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^< (57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 
QO tides > sucn 35 ce llular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 
fN| replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 
^ vaccines, diagnostic tools, DNA chips and for identifying therapeutic targets. 

S ( 57 ) Abreg6 : L T invention a pour objet la sequence genomique et des sequences nucleotidiques codant pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques 

^2 dans l e m£tabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules incluant lesdites sequences. L' invention 
porte egalement sur leur application au developpement de vaccins, d'outils de diagnostic, de puces a ADN et a 1' identification de 
cibles thdrapeutiqucs. 
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Sequence du genome Streptococcus agalactiae^ application au developpement de 
vaccins, d'outils de diagnostic, et a l'identification de cibles therapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucteotidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides s6cret£s ou specifiques, ou impliques dans 
le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L'invention porte egalement sur leur application au 
developpement de vaccins, d'outils de diagnostic, de puces a ADN et a nderitificafion 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque p-hemolytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections neonatales a 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

1 5 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialises 
entre 4 et 10 % selon les etudes. Cette bacterie est responsable d'environ 20 % des 
meningites bacteriennes recensees en France et des s^quelles neurologiques sont alors 
observees dans 25 a 50 % des cas. EUe est egalement a Torigine de mort foetale in utero. 

20 Le polyoside capsulaire est Tantigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont generalement detectes au cours des infections humaines, le serotype 
HI etant retrouve dans 75 % des infections neonatales avec atteinte m£ningee. Au 
niveau cellulaire et moleculaire, les difKrentes etapes du processus infectieux du a S. 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee p^netre 
dans les cellules de l'epitheiium alv^olaire du nouveau-n£ et traverse cette barridre pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore trds mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a 6te clairement demontre est le polyoside capsulaire qui permet 
J'echappement au systeme immunitaire de l'hote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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Une recherche realisee sur le site EXP AS Y (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprot et 
TREMBL. Ce nombre inclut des proteines codees par des plasmides de S. agalactiae. 
Ces sequences representent done une vision partielle d f un nombre limite d'aspect de la 
5 biologie de S. agalactiae. La biosynth£se de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les genes codant 
pour 6 proteines exposees a la surface sont egalement connus (3). 

Afin d'apprchender de mariiere giobaie les determinants genetiques impiiquSs 

1 0 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sequen9age 
du genome de Streptococcus agalactiae a &t& r6alis6. Le genome de la souche 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) qui a €te responsable d'une 
septicemic mortelle a ete choisi pour ce sequen9age. Cette souche possede un serotype 
capsulaire III, ne presente pas de resistance acquise aux antibiotiques, est g^netiquement 

1 5 modifiable et est virulente dans un modele d'infection murin. La connaissance complete 
du genome est une etape cruciale pour la caracterisation des genes impliques dans le 
developpement du processus infectieux : adhesion et franchissement des structures 
epitheliales, echappement au systeme immunitaire et adaptation a des conditions de 
culture variees et souvent hostiles (pH, stress oxydatif et carences nutritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de S. agalactiae avec ceux d'autres pathogenes a Gram positif 
(Streptococcus pyogenes, Streptococcus pneumoniae, Streptococcus mutans t 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre dldentifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour construire des souches de 

25 virulence attenuees et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane et presentant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete obtenue. Ce genome est constitue d'un chromosome long 
d'environ 2,2 Mb identify ici sous forme de 138 contigs repr£sent6s par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche s^quencee repr^sente par la sequence SEQ ID 
No. 137. La sequence complete du genome est representee par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotees identifiees par l'analyse des sequences de 
5 ces contigs est donnee au tableau 1 . 

Une liste des phases codantes pour des prolines de surface nouvellement 
identifies est donnee au tableau 2 comme indiqu6 pr^c^demment. 

Une liste des phases codantes annotees identifiees par l'analyse de la sequence 
genomique complete SEQ ID No. 2345 est donnee au tableau 3. 
1 0 Une liste des phases codantes pour des proteines de surface identifiees a partir 

de l'analyse de la sequence genomique complete SEQ ID No. 2345 est donnee au 
tableau 6 (proteines liees au peptidoglycane), tableau 8 (lipoproteines).Tableau 9 (autres 
proteines de suface), Tableau 10( proteines impliquees dans la biosynthese des 
composes polysaccharidiques) 

15 

La presente invention concerne les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caracteriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 genomique prepare a partir du genome de cette souche et deposee a la CNCM le 28 
decembre 2000 sous le numero 1-2610, ainsi que de tous les genes et sequences 
r^gulatrices non codantes contenus dans ledit genome. 

La presente invention concerne done une sequence nucleotidique isolee et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 1 39 et la sequence SEQ ID No. 2345. 

La presente invention concerne egalement une sequence nucleotidique isolee 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % dMdentite avec une sequence choisie parmi SEQ ID No. 1 k SEQ ID No. 139 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 k SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 

correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representalif d^ane sequence nucleotidique telle que definie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 
200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee, de 
15 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport k la sequence de reference. 

De fa9on plus particuliere, la presente invention a egalement pour objet les 
sequences nucleotidiques isolees et/ou purifiees, caracterisees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 a SEQ ID 
No. 2344, et SEQ ID No. 2346 a SEQ ID No. 448 1 . 

La presente invention concerne aussi de fa?on plus generale les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent etre 
25 isolees a partir de SEQ ID No. 1 a SEQ ID No. 1 39 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isolees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 k SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %,. 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 
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c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment repr£sentatif d'une sequence telle que 
definie en a), b), c) ou d) et CGrnpreriant au rncins 20 r±ueieoudes, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 

nucleotides ; et 

f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de F invention. 

Selon une realisation avantageuse, Finvention a pour objet les sequences 
nucteotidiques isol£es et/ caract6ris£es en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 6617 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 £ SEQ ID 

25 No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 
75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant & une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
30 definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

5 Par acide nucleique, sequence nucleique ou d' acide nucleique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un fragment 
eu une regien d'un acide nucleique, -eomportant gu non des nucleotides non natureis, et 

10 pouvant correspondre aussi bien a un ADN double brin, un ADN simple brin qu'a des 
produits de transcription desdits ADNs. Ainsi, les sequences nucleiques selon 
Tinvention englobent egalement les PNA (Peptid Nucleic Acid). 

II doit etre compris que la presente invention ne concerne pas les sequences 
nucleotidiques dans leur environnement chromosomique naturel, c'est-a-dire a l'etat 

1 5 naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a-dire qu'elles ont 
ete prelevees directement ou indirectement, par exernple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucleiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d' acides nucleiques ou 

20 d'acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 

25 optimal", Talignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparaisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladite comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 

30 regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de Palgorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
Palgorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afin d'obtenir Talignernent optimal, on utilise de preference le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut 6galement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de mani&re optimale, la 
sequence d'acides nucleiques gu d -aeides amines a comparer pouvant comprendre des 

10 additions ou des deletions par rapport a la sequence de reference pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identite est calcule en determinant 
le nombre de positions identiques pour lesquelles le nucleotide ou le residu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 

1 5 obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de fa<?on plus preferee 95 % voire 98 %, apres 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de reference, certaines 

20 modifications comme en particulier une delation, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 %, 
d'identite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences complementaires sont susceptibles de 

25 s'hybrider specifiquement avec les sequences de reference. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % d'identite 
apres alignement optimal entre 1'une des deux sequences et sa sequence 
complementaire. 

30 Une hybridation dans des conditions de forte stringence signifie que les 

conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de 1' hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de Petape d'hybridation aux fins de 
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definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC correspond £ une solution 0,15 M NaCl + 0,015 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt f s, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures a une temperature dependant de la taille de la sonde 
(i.e. : 4*2°C, pour une -sonde de taille > 1 GG Traclcotides) suivie de 2 lavages de 20 
10 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d'hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille definie, peuvent 
etre adaptees par l'homme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2 nd Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon 1' invention, on entend 
designer tout fragment nucleotidique presentant au moins 1 5 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1 500 cons6cutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend egalement les sequences interg^niques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, . . .). 

Parmi lesdits fragments representatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denommes sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d 1 initiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 100 acides amines, tel que par exemple, sans s'y 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotation des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la pr^sente description correspond a la numerotation des sequences d'acides 
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amines des prolines cod£es par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 & SEQ ID No.4481. 

Les fragments represent atifs selon 1' invention peuvent etre obtenus par exemple 
par amplification specifique telle que la PCR ou apres digestion par des enzymes de 
5 restriction approprids de sequences nucleotidiques selon P invention, cette m£thode &ant 
decrite en particulier dans Pouvrage de Sambrook et al.. Lesdits fragments 
repr^sentatifs peuvent egalement etre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des methodes bien connues de Phomme du metier. 

Paimi les sequences -eon-tenant des sequences de Pinvention, ou des fragments 
1 0 representatifs, on entend egalement les sequences qui sont naturellement encadrees par 
des sequences qui presentent au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % 
d'identite avec les sequences selon P invention. 

Par sequence nucleotidique modifiee, on entend toute sequence nucleotidique 
obtenue par mutagenese selon des techniques bien connues de Phomme du metier, et 
15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de Pexpression du 
polypeptide, notamment conduisant a une modification du taux d'expression ou de 
Pactivite dudit polypeptide. 

Par sequence nucleotidique modifiee, on entend egalement toute sequence 
20 nucleotidique codant pour un polypeptide modifie tel que d^finit ci-apres. 

Concernant les sequences nucleiques ou ORF codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
representees respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L'invention concerne avantageusement une sequence nucleotidique isolee de 
25 Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247,5842,5741,4921,509^ 
5180,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d' ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modiftee et comportant 

au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proline de surface avec un motif d'ancrage 
LPXTG. 

LMnvention eoneerne egalemenries polypeptides codes par ces sequences. 
10 L' invention concerne egalement avantageusement une sequence nucleotidique 

isol6e de Streptococcus agalactiae caracteris^e en ce qu'elle est choisie parmi les 
sequences SEQ ID 

N%035,6137,6335,6377,6386,4495,4596,4636,4730,4816^ 

5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 ; et en ce 

15 qu'elle code pour une lipoproteins L'invention concerne egalement les polypeptides 
codes par ces sequences. 

L'invention concerne egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 N°4861,6214,6061,6517,6518,6519^ 

5615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention concerne egalement les polypeptides codes par 

25 . ces sequences. 

Les fragments representatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des procedes de detection, d' identification, 
de dosage ou d'amplification de sequences nucteiques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin d6natur6 
comprenant par exemple de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificite 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucl&que cible. 
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Les sondes et amorces selon V invention peuvent etre marquees directement ou 
indirectement par un compose radioactif ou non radioactif par des methodes bien 
connues de Phomme du metier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon 1' invention peuvent etre 

utilises directement comme sonde ou amorce. 

Les sequences sont g£neralement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon l'invention est realise par des elements radioaetifs ou par des molecules non 
1 0 radioactives. 

Parmi les isotopes radioaetifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou 
le ,25 L Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
l'avidine, la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon Finvention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(amplification en chaine par polymerase) (Rolfs et al., 1991, Berlin : Springer-Verlag). 
Cette technique necessite le choix de paires d'amorces oligonucleotidiques encadrant le 

20 fragment qui doit etre amplifie. On peut, par exemple, se referer a la technique decrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une 61ectrophorese en gel d' agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographic £changeuse d'ions, puis sequences. La specificite de P amplification 

25 peut etre controlee en utilisant les sequences nucleotidiques de polynucleotides de 
l'invention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d' amplification derives. Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 compl^mentaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus par 
amplification a Taide d'amorces selon l'invention. 

D'autres techniques d'amplification de Tacide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a l'aide de couple 
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d'amorces de sequences nucleotidiques selon Pinvention. Par PCR-like on entend 
designer toutes les methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesqueiles les systemes de marquage 
ont 6te amplifies, ces techniques sont bien entendu connues. En general il s'agit de 
5 P amplification de PADN par une polymerase ; lorsque Pechantillon d'origine est un 
ARN il convient pr^alablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux proc£d£s permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d' amplification a deplacernent de brin (Walker et al., 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. Sci., USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d' amplification a la Q-beta-replicase decrite 

20 par Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis 
6t6 perfectionn^es. 

Dans le cas oil le polynucleotide cible h d&ecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d' amplification a 
Paide des amorces selon l'invention ou a la mise en oeuvre d'un procede de detection a 

25 Paide des sondes de Pinvention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de PARNm contenu dans Pechantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procede 
d'amplification ou de detection selon Pinvention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generate 
consiste a immobiliser Pacide nucleique extrait des cellules de differents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien d^finies, Pacide nucleique cible immobilise avec la 
sonde. Apres P hybridation, Pexces de sonde est elimine et les molecules hy brides 



WO 02/092818 



13 



PCT/IB02/03059 



formees sont detect^es par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de Pactivite enzymatique liee a la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucleiques selon Pinvention, 
ces dernieres peuvent etre utilisees comme sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisee sur un support et sert & capturer par 
hybridation specifique l'acide nucteique cible obtenu a partir de Pechantillon biologique 
a tester et l'acide nucleique cible est ensuite detecte grace a une seconde sonde, dite 
« sonde de detection », marquee par un element facilement detectable. 

Parrni les fragments d'ae-ides nueleiques interessants, ii faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de l'expression du produit 
correspondant. II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des prolines impliquees dans la regulation de l'expression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De fafon prefer^e, les sondes ou amorces selon Pinvention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
mat^riau du support, et eventuellement le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents procedes de fabrication. En 
particulier, on peut effectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent & effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces diffcrents proc£d6s sont bien connus de l'homme du metier. 

Une sequence nucleotidique (sonde ou amorce) selon Pinvention permet done la 
detection et/ou Pamplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce k 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces a ADN ou de filtres a haute density permet en effet de 
determiner Pexpression de genes dans un organisme presentant une sequence 
genomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence genomique de Streptococcus agalactiae, compl£tee par 
5 P identification des gfenes de ces organismes, telle que presentee dans la presente 
invention, sert de base a la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste a synth£tiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des genes ou a des fragments plus internes pour 
AOipliS^-des^gine-nls-d'-une'taille adaptee, par example comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence genomique et ses 
annotations divulguees par la presente invention. La temperature d'appariement des ces 
oligonucleotides aux places correspondantes sur TADN doit etre approxirnativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d'ADN 
correspondant a chaque gene par l'utilisation de conditions de PCR appropriees dans un 

15 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour I'hybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier l'expression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
complementaires, et en les hybridant a l'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variability des souches ou des especes, en preparant l'ADN de ces organismes et en les 

25 hybridant a l'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
especes peuvent grandement affecter l'intensite de I'hybridation et, par consequent, 
perturber Interpretation des resultats. 11 peut done etre necessaire d'avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decrite plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae, notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 
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Les sequences nucleotidiques selon Pinvention peuvent etre utilisees dans des 
puces a ADN pour effectuer Panalyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon Pinvention. On pourra notamment a cette fin mettre en ceuvre les techniques de 
5 microsequen9age sur puce a ADN. Les mutations sont detectees par extension 
d'amorces immobilisees hybridant a la matrice des sequences analys£es, juste en 
position adjacente de celle du nucleotide mute recherche. Une matrice simple brin, ARN 
ou ADN, des sequences a analyser sera avantageusement preparee selon des m^thodes 
elassiques, a pariir de produits amplifies seion les techniques de type PGR. Les matrices 

1 0 d'ADN simple brin, ou d'ARN ainsi obtenues sont alors deposees sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement Textremite 3' de Tamorce immobilisee avec un analogue de nucleotide 
marque complementaire du nucleotide en position du site variable ; par exemple, un 

1 5 cyclage thermique est realise en presence des dideoxyribonucleotides fluorescents. Les 
conditions experimentales seront adaptees notamment aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequen9age, par rapport aux techniques basees sur Thybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homog£nes ; utilise sur des 
puces a ADN, il permet une resolution et une specificite optimales pour la detection 
routiniere et industrielle de mutations en multiplex. 

Une puce & ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou T identification d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon Tinvention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apres designees comme bacteries associ^es a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Une puce a ADN ou un filtre selon Pinvention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou 1' identification de micro-organismes, 
en particulier les bacteries appartenant a Pespece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de Pinvention. 
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Par ailleurs, les puces a ADN ou les filtres selon 1' invention, contenant des 
sondes ou amorces specifiques de Streptococcus agalactiae, sont des Aliments tres 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
l'expression de genes de Streptococcus agalactiae (ou de micro-organismes associes). 
5 En effet, le controle de l'expression des g6nes est un point critique pour 

optimiser la croissance et le rendement d'une souche, soit en permettant l'expression 
d'un ou plusieurs genes nouveaux, soit en modifiant l'expression de genes d6ja presents 
dans la cellule. La presente invention fournit 1'ensemble des sequences naturellement 
actives ehez Streptococcus agalactiae permettant rexpression des genes. Bile permet 

10 ainsi la determination de I'ensemble des sequences exprimees chez Streptococcus 
agalactiae. Elle fournit egalement un outil permettant de reperer les g£nes dont 
l'expression suit un schema donne. Pour realiser cela, l'ADN de tout ou partie des genes 
de Streptococcus agalactiae peut etre amplifie grace a des amorces selon invention, 
puis fixe a un support comme par exemple le verre ou le nylon ou une puce & ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces genes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation a 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon I'invention). En rep6tant cette 
experience a differents instants et en combinant 1'ensemble de ces donnees par un 

20 traitement approprii, on obtient alors les profits d'expression de 1'ensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise k profit pour rechercher de maniere dirigee, par exemple par homologie, 
d'autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle presente en amont des segments servant de sondes et d'en suivre l'activite a 
l'aide de moyen approprie comme un gene rapporteur (luciferase, P-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblies par ingenierie 
metabolique avec des sequences d'interet en vue de leur expression optimale. 

L' invention concerne Egalement les polypeptides codes par une sequence 

30 nucleotidique selon Pinvention, de preference, par un fragment representatif des 
sequences precedentes et correspondant & une sequence ORF. En particulier, les 
polypeptides de Streptococcus agalactiae CIP 82.45 (ATCC 12403) de SEQ ID No. 140 
k SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de Pinvention. 
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L'invention comprend egalement les polypeptides caracterises en ce qu'ils 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon l'invention ; 

b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 d'identite avec un polypeptide selon l'invention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d'un polypeptide selon l'invention, ou tel que 
defini en b) ; 

d) un fragment bielegiquement aetif d'au polypeptide selon ^invention, ou tei que 
1 0 defini en b) ou c) ; et 

e) un polypeptide selon l'invention, ou tel que defini en b), c) ou d) modi fie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucleotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de l'invention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de gen6rer une reponse anticorps. 

II doit etre compris que l'invention ne concerne pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle concerne ceux qui ont pu etre isoles ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera Egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80%, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon l'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non consecutif(s) sont remplaces par des 
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acides amines « equivalents ». L'expression « acides amines Equivalents » vise ici a 
designer tout acide amin6 susceptible d'etre substitue a Tun des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides correspondant telles qu'elles seront definies par la suite. 
5 Ces acides amines equivalents peuvent etre determines soit en s'appuyant sur 

leur homologie de structure avec les acides amines auxquels ils se substituent, soit sur 
des resultats d'essais comparatifs d'activite biologique entre les differents polypeptides 
susceptibles d'etre effecUtes. 

A titre d'exernple, on mentionne les possibilitfe de substitution susceptibles 

10 d'etre effectuees sans qu'il resulte en une modification approfondie de l'activite 
biologique du polypeptide modifte correspondant. On peut remplacer ainsi la leucine 
par la valine ou Pisoleucine, 1'acide aspartique par 1'acide glutamine, la glutamine par 
1'asparagine, l'arginine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

1 5 Les polypeptides homologues correspondent egalement aux polypeptides codes 

par les sequences nucleotidiques homologues ou identiques, telles que definies 
precedemment et comprennent ainsi dans la presente definition des polypeptides mutes 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus ; et qui correspondent notamment a des troncatures, substitutions, 

20 deletions et/ou additions, d'au moins un residu d'acides amines. 

II est entendu que Ton calcule le pourcentage d'identite entre deux polypeptides 
de la meme fa9on qu'entre deux sequences d'acides nucleiques. Ainsi, le pourcentage 
d'identite entre deux polypeptides est calcule apres alignement optimal de ces deux 
sequences, sur une fenetre d'homologie maximale. Pour definir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nucleique. 

Par fragment biologiquement actif d'un polypeptide selon 1' invention, on entend 
designer en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon l'invention, 
30 notamment en ce qu'il est capable d'exercer de mantere generate une activite meme 
partielle, telle que par exemple : 

- une activite enzymatique (metabolique) ou une activite pouvant etre 
impliquEe dans la biosynthdse ou la biod6gradation de composes organiques ou 
inorganiques ; 
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- une activite structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activite de transport (d'6nergie, d'ion) ; ou dans la secretion de proteine ; 

- une activite dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notamment de PADN, de TARN ou des 

proteines. 

Par fragment de polypeptide selon Pinvention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, SO, 75, 100 et 150-aeides -amines. 

1 0 Les fragments de polypeptides peuvent correspondre a des fragments isoles ou 

purifies naturellement presents dans les souches de Streptococcus, ou a des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme prot6olitique 
telle que la trypsine ou la chymotrypsine ou la collag^nase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en pla9ant ledit polypeptide dans un environnement 

1 5 tres acide (par exemple a pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthese chimique, k partir d'hotes transformes par un vecteur 
d'expression selon Pinvention qui contiennent un acide nucleique permettant 
l'expression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie » d'un polypeptide selon Pinvention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthese chimique 
comme decrit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment portees sur des acides 
amines necessaires pour la specificite ou Pefficacit6 de Pactivite, ou a Porigine de la 

25 conformation structurale, de la charge, ou de Phydrophobicite du polypeptide selon 
Pinvention. On peut ainsi creer des polypeptides d'activite equivalente, augmentee ou 
diminuee, ou de specificite Equivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a Pextrdmite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d 7 un polypeptide ont pour objectif 
notamment : 

- de pennettre sa mise en oeuvre dans des procedes de biosynthese ou de 
biodegradation de composes organiques ou inorganiques, 
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- de permettre sa mise en oeuvre dans des procedes de replication, 
d'amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de l'ADN, TARN, ou de proteines, 

- de permettre sa secretion amelioree, 

5 -de modifier sa solubility, Fefficacit6 ou la specificity de son activity, ou 

encore de faciliter sa purification. 

La synthese chimique presente egalement l'avantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
•intSKSsant-d'utiii'SeF^es-'acides-amifi^s non naturels, -par exempie sous forme D, ou des 
1 0 analogues d'acides amines, notamment des formes soufFrees. 

La presente invention fournit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere preferee, 1'invention est relative a une sequence nucleotidique 
15 selon l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des acides amines. 

De maniere preferee, 1' invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporters. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere pref<£r£e, l'invention est relative a une sequence nucleotidique selon 

l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme intermediaire central. 
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De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
1' invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme energetique. 
5 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

T invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des acides gras et des phospholipides. 

Be maniere preferee, "invention est relative a une sequence nucleotidique selon 
10 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
20 de replication. 

De manidre preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
30 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, Pinvention est relative & une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans P adaptation 
aux conditions atypiques. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
T invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibilite aux 
medicaments et analogues. 

De maniere preferee, 1' invention est relative a une sequence nucleotidique selon 
1' invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
ugaiucuae oir "(htcc iZHio/ ou un ue ses Iragmems impnque cans ies 

1 0 fonctions relatives aux transposons. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
1'invention, caracterisee en ce qu'elle code pour un polypeptide specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
15 polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments impliqu6 
dans la biosynthese des acides amines. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des cofacteurs, groupes prosthetiques et transporters. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere prefiSree, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de manidre preferee, Pinvention a pour objet un 

polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme interm6diaire central. 
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Sous un autre aspect, de maniere preferee, T invention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme energetique. 
5 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des acides gras et des phospholipides. 

Sous un autre -aspect, de Tnaniere preferee, ^'invention a pour objet un 
10 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
30 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
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Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans l'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibilite aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403} ou un de ses fragments impiique 
1 0 dans les fonctions relatives aux transposons. 

Sous un autre aspect, de maniere pr6fi£r6e, Pinvention a pour objet un 
polypeptide selon Pinvention, caracterise en ce qu'il s'agit d'un polypeptide specifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L' invention a 6galement pour objet les op^rons impliqu£s dans la synthese 
1 5 d'antibiotiques et/ou de toxines. 

Le tableau 1 fournit la liste de certains polypeptides selon Pinvention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observees apres comparaison dans les bases de donnees. 

20 II est important de noter toutefois qu'un organisme vivant est un tout et doit etre 

pris comme tel. Ainsi, afin de pouvoir se developper et exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les differentes voies mdtaboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre consideree comme limitative, un gene 
pouvant etre impliqu£ dans deux voies metaboliques distinctes. 

25 La presente invention a egalement pour objet les sequences nucleotidiques et/ou 

de polypeptides selon Pinvention, caract^risees en ce que lesdites sequences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, Panalyse et/ou Pexploitation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations extraites de la presente invention, 

30 notamment les analogies avec des sequences deja connues, et/ou des informations 
concernant les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afin de faciliter Panalyse comparative et Pexploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on pr£f6re en particulier les supports 
lisibles par un ordinateur, tels les supports magnetiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de l'invention. 

Les supports d'enregistrement selon l'invention, avec les informations 
apportees, sont tres utiles pour le choix d' amorces ou de sondes nucleotidiques pour la 
5 determination de genes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, Putilisation de ces supports pour l'etude 
du polymorphisme genetique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de coIinearit£, est 
tres utile dans la mesure gu ees supports foixrnissent non seuiement ia sequence 
10 nucleotidique du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
egalement l'organisation genomique dans ladite sequence. Ainsi, les utilisations de 
supports d'enregistrement selon 1'invention sont egalement des objets de 1'invention. 

L' analyse d'homologie entre dififcrentes sequences s'effectue en effet 
avantageusement a 1'aide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

L'invention vise egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucleotidique selon l'invention. 

Les vecteurs selon l'invention comportent de preference des elements qui 
permettent V expression et/ou la secretion des sequences nucleotidiques dans une cellule 
20 hote determinee. 

Le vecteur doit alors comporter un promoteur, des signaux d'initiation et de 
terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de fa9on stable dans la cellule hote et peut 
eventuellement posseder des signaux particuliers qui sp^cifient la secretion de la 
25 proteine traduite. Ces differents elements sont choisis et optimises par l'homme du 
metier en fonction de l'hote cellulaire utilise. A cet effet, les sequences nucleotidiques 
selon l'invention peuvent etre inserees dans des vecteurs a replication autonome au sein 
de l'hote choisi, ou etre des vecteurs integratifs de l'hote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 l'homme du metier, et les clones resultant peuvent etre introduits dans un hote approprie 
par des methodes standards, telles que la lipofection, l'electroporation, le choc 
thermique, ou des methodes chimiques. 
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Les vecteurs seion Pinvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules hotes afin de doner 
ou d'exprimer les sequences nucleotidiques seion l'invention. 

L' invention comprend egalement les cellules hotes transform£es par un vecteur 
5 seion Tinvention. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes ou eucaryotes, 
par exemple les cellules bact^riennes mais egalement les cellules de levure ou les 
cellules animales, en particulier les cellules de mamrniferes. On peut Egalement utiliser 
des cellules d'inseetes ou des cell ales de plantes. Les cellules holes preferees seion 
10 l'invention sont en particulier les cellules procaryotes, de preference les bacteries 
appartenant au genre Streptococcus, a l'espece Streptococcus agalactiae, plus 
particulierement Streptococcus agalactiae CIP 82.45 (ATCC 12403), ou les micro- 
organismes associes a l'espece Streptococcus agalactiae. 

L'invention concerne egalement les vegetaux et les animaux, excepte l'homme, 
15 qui comprennent une cellule transform^ seion l'invention. Les cellules transformees 
seion l'invention sont utilisables dans des procedes de preparation de polypeptides 
recombinants seion l'invention. Les procedes de preparation d'un polypeptide seion 
l'invention sous forme recombinante, caracterises en ce qu'ils mettent en oeuvre un 
vecteur et/ou une cellule transformee par un vecteur seion l'invention sont eux-memes 
20 compris dans la pr£sente invention. De preference, on cultive une cellule transformee 
par un vecteur seion l'invention dans des conditions qui permettent l'expression dudit 
polypeptide et on r£cupere ledit peptide recombinant. 

Ainsi qu'il a 6t6 dit, l'hote cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d'identifier des sequences 
25 nucleotidiques seion l'invention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur seion l'invention portant une telle sequence peut done etre 
avantageusement utilise pour la production de prolines recombinantes, destinies a etre 
secretes. En effet, la purification de ces proteines recombinantes d'interet sera facilitee 
par le fait qu'elles sont presentent dans le surnageant de la culture cellulaire plutot qu'a 
30 l'interieur des cellules hotes. 

On peut egalement preparer les polypeptides seion l'invention par synthese 
chimique. Un tel procede de preparation est egalement un objet de l'invention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, 
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Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2eme ed., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont egalement compris dans 1' invention. 

L'invention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon l'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez Phomme ou P animal. 

Avantageusement, ie determinant antigeniqae est tei qu'ii est susceptible 
1 0 d'induire une reponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon l'invention sous forme glycosylee, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyles font egalement partie de 
15 l'invention. 

Ces molecules hybrides peuvent etre constitutes en partie d'une molecule 
porteuse de polypeptides ou de leurs fragments selon l'invention, associee a une partie 
eventuellement immunogene, en particulier un epitope de la toxine diphterique, la 
toxine tetanique, un antigene de surface du virus de P hepatite B (brevet FR 79 2181 1), 
20 Pantigene VP1 du virus de la poliomy&ite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les procedes de synthese des molecules hybrides englobent les methodes 
utilisees en gtnie gen&ique pour construire des sequences nucleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des proteines 
de fusion d6crite par Minton en 1984. 

Lesdites sequences nucleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon l'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par Pexpression desdites sequences nucleotidiques 
30 hybrides, font Egalement partie de l'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules hotes 
transformees par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules transformees ainsi que les proc&tes de preparation de polypeptides 
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recombinants utilisant lesdits vecteurs, lesdites cellules transformtes et/ou lesdits 
animaux transgeniques font egalement partie de Pinvention. 

Le couplage entre un polypeptide selon Pinvention et un polypeptide 
immunogene peut etre effectue par voie chimique, ou par voie biologique. Ainsi, selon 
5 1' invention, il est possible d'introduire un ou plusieurs £lement(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
Pinvention, et le polypeptide immunostimulateur, le couplage covalent de Pantigene 
immunostimulateur pouvant etre realise a P extremity N ou C-terminale du polypeptide 
seion i ? invention. Les reactifs bifonctionneis permettant ce couplage sorit determines en 

10 fonction de Pextremite choisie pour realiser ce couplage, et les techniques de couplage 
sont bien connues de Phomme du metier. 

Les conjugues issus d'un couplage de peptides peuvent etre egalement prepares 
par recombinaison gen&ique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d' ADN recombinant, par insertion ou addition a la sequence d'ADN 

15 codant pour le polypeptide selon Finvention, d'une sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison genetique sont bien connues de Phomme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews 60,512-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoide dipht^rique ou le toxoide 
tetanique, les proteines derivees du Streptocoque (comme la proteine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
prolines de membranes externes, les vesicules de membranes externes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon Pinvention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre specifiquement les 
polypeptides selon Pinvention. En effet, un polypeptide hybride selon Pinvention 
permet la potentialisation de la r^ponse immunitaire, contre le polypeptide selon 
Pinvention couple a la molecule immunogene. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chim£riques, reconnaissant les 
polypeptides selon Pinvention, sont egalement objet de Pinvention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridome d^crite par Kohler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon Pinvention sont par exemple des anticorps chimeriques, des 
anticorps humanisms, des fragments Fab, ou F(ab') 2 . lis peuvent egalement se presenter 
sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon Pinvention peuvent etre employes dans un proced£ 

pour la detection et/ou P identification de bacteries appartenant a Pespece Streptococcus 
agalactiae ou a un micro-organisme associe dans un echantillon biologique, caracterise 
en ce qu'il comprend les etapes suivantes: 

a) mise en contact de Pechantiiion biologique avec un anticorps selon Pinvention ; 

10 b) mise en evidence du complexe antigene-anticorps £ventuellement forme. 

Les anticorps selon la presente invention sont egalement utilisables afin de 
detecter une expression d'un gene de Streptococcus agalactiae ou de micro-organismes 
assoctes. En effet, la presence du produit d'expression d'un gene reconnu par un 
anticorps specifique dudit produit d'expression peut etre detectee par la presence d'un 

15 complexe antigene-anticorps form£ apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
Pinvention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifug£e, lysee, plac^e dans un reactif approprie pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de Pexpression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apres une electrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en Pabsence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on d6tecte la presence de la 

25 proteine ou du polypeptide d'interet, par mise en contact de ladite membrane avec un 
anticorps selon Pinvention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en ceuvre d'un proc&te tel que decrit (de detection de Pexpression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 P identification de bacteries appartenant a Pespece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon Pinvention ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
immunologique ; 
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c) 6ventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon l'invention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce a proteines 
5 est un objet de l'invention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirig£ contre un compose d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou -filtres a haute densite contenant des proteines selon 
10 l'invention peuvent etre construites de la meme maniere que les puces a ADN selon 
l'invention. En pratique, on peut effectuer la synthese des polypeptides directement 
fixes sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une etape de 
fixation sur ladite puce du polypeptide synthetise. Cette derniere methode est preferable, 
lorsque Ton desire fixer des proteines de taille importante sur le support, ces proteines 
1 5 etant avantageusement preparees par genie genetique. Toutefois, si Ton ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proceder a 
la synthese desdits peptides directement in situ. 

Les puces a proteines selon l'invention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou 1' identification de bacteries 
20 associees a l'espece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de fa<?on plus generate dans des kits ou necessaires pour la detection 
et/ou F identification de micro-organismes. Lorsque Fon fixe les polypeptides selon 
l'invention sur les puces a ADN, on recherche la presence d'anticorps dans les 
echantillons testes, la fixation d'un anticorps selon l'invention sur le support de la puce 
25 a proteines permettant Identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon l'invention sur le support de la puce a 
proteines, et on d^tecte la presence de Fantigene correspondant, specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 

Une puce & prolines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de g£nes, pour etablir un profil d'expression desdits genes, en complement 
d'une puce a ADN selon l'invention. 

Les puces a proteines selon l'invention sont egalement extremement utiles pour 
les experiences de proteomique, qui 6tudie les interactions entre les differentes prolines 
d'un micro-organisme donne. De fa90n simplifiee, on fixe des peptides repr^sentatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des proteines marquees, et apres une etape optionnelle de rinyage, on 
detecte des interactions entre Iesdites proteines marquees et les peptides fixEs sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

Pinvention ou un anticorps selon Pinvention sont objet de Pinvention, ainsi que les kits 
ou necessaires les contenant. 

La presente invention couvre Egalement un procede de detection et/ou 
d ' identification de bacteries appartenaiit a P espece Streptococcus agaiactTae CIP 82.45 
10 (ATCC 12403) ou h un micro-organisme associe dans un Echantillon biologique, qui 
met en oeuvre une sequence nucleotidique selon Pinvention. 

II doit etre entendu que le terme Echantillon biologique concerne dans la 
presente invention les Echantillons preleves a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres preleves a partir d'un mammifere) ou un 
15 echantillon contenant du materiel biologique, c'est-a-dire de l'ADN ou de PARN. Un 
tel Echantillon biologique comprend aussi les compositions alimentaires contenant des 
bacteries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique concerne aussi les bacteries isolees a partir de ces prelevements 
20 ou compositions alimentaires. 

Le procede de detection et/ou d' identification mettant en ceuvre les sequences 
nuclEotidiques selon Pinvention peut etre de diverse nature. 

On prefere un procede comportant les Etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de Techantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de PARN de P Echantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant h Pespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe a Paide d'au 
moins une amorce selon Pinvention ; 

c) mise en evidence des produits d'amplification. 

30 Ce procede est base sur Pamplification specifique de l'ADN, en particulier par 

une reaction d'amplification en chaine. 

On pref&re Egalement un procEdE comprenant les Etapes suivantes : 
a) mise en contact d'une sonde nuclEotidique selon Pinvention avec un Echantillon 
biologique, Pacide nuclEique contenu dans PEchantillon biologique ayant, le cas 
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echeant, prealablement ete rendu accessible a l'hybridation, dans des conditions 
permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie appartenant a 
Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associe ; 

5 b) mise en evidence de 1'hybride eventuellement forme entre la sonde nucleotidique et 
PADN de Pechantillon biologique. 

Un tel procede ne doit pas etre limite a la detection de la presence de PADN 
content! dans Pechantillon biologique a tester, il peut etre egalement mis en ceuvre pour 
deteeter I'ARN contenu dans ledit echantiiion. Ce procede engiobe en parttculier Tes 
1 0 Southern et Northern blot. 

Un autre procede prefere selon 1' invention comprend les etapes suivantes : 

a) rnise en contact d'une sonde nucleotidique immobilisee sur iin support selon 
Pinvention avec un echantiiion biologique, l'acide nucleique de Pechantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 

15 conditions permettant l'hybridation de la sonde a Pacide nucleique d'une bacterie 

appartenant a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
micro-organisme associe ; 

b) mise en contact de Phybride forme entre la sonde nucleotidique immobilisee sur un 
support et Pacide nucleique contenu dans Pechantillon biologique, le cas echeant 

20 apres elimination de PADN de Pechantillon biologique n'ayant pas hybride avec la 
sonde, avec une sonde nucleotidique marquee selon Pinvention ; 

c) rnise en evidence du nouvel hybride forme a Petape b). 

Ce procede est avantageusement utilise avec une puce & ADN selon Pinvention, 

Pacide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
25 puce, et etant detecte par Putilisation d'une sonde marquee. Ce procede est 

avantageusement mis en ceuvre en combinant une etape prealable d'amplification de 

PADN ou de PADN compiementaire obtenu eventuellement par transcription inverse, a 

Paide d'amorces selon Pinvention. 

Ainsi, la presente invention engiobe egalement les kits ou necessaires pour la 
30 detection et/ou P identification de bacteries appartenant a Pespece Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 

qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Pinvention ; 
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b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d* hybridation ; 

c) Eventuellement, au moins une amorce selon T invention ainsi que les reactifs 
necessaires a une reaction d'amplification de P ADN. 

5 De meme, la presente invention englobe £galement les kits ou necessaires pour 

la detection et/ou 1' identification de bacteries appartenant a Pespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterisE en ce 
qu'il comprend les elements suivants : 

a) une sonde nucieotidique, dice sonde de capture, selon P invention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Pinvention ; 

c) eventuellement, au moins une amorce selon ('invention ainsi que les reactifs 
necessaires a une reaction d'amplification de l'ADN. 

Enfin, les kits ou necessaires pour la detection et/ou T identification de bacteries 
appartenant a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pinvention ; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Pinvention, 

sont egalement objet de la presente invention. 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les procedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De manure pr£f$ree, ces Elements sont choisis parmi les sequences nucleotidiques 
codant pour une proteine s6cretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes assoctes contenant une 
ou plusieurs mutation(s) dans une sequence nucieotidique selon Pinvention, en 
particulier une sequence ORF, ou leurs Elements regulateurs (en particulier promoteurs). 
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On prefere, selon la presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucleotidiques codant pour des polypeptides impliqu6s dans la machinerie cellulaire, en 
particulier la secretion, le metabolisme intermediate central, le metabolisme 
5 energ&ique, les processus de synthase des acides amines, de transcription et de 
traduction, de synthese des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situ^es dans les elements r^gulateurs dudit gene, a une surexpression 
de ceiui-cL 

10 L'invention concerne en outre Putilisation d'une sequence nucleotidique selon 

Pinvention, d'un polypeptide selon l'invention, d'un anticorps selon l'invention, d'une 
cellule selon l'invention, et/ou d'un animal transforme selon l'invention, pour la 
selection de compost organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 

15 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
une pathologies liees a une infection par Streptococcus agalactiae ou un de ses micro- 
organismes associes. 

L'invention comprend egalement une m6thode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon l'invention, capables 

20 de se Her a une sequence nucleotidique selon l'invention, ou capables de reconnaitre un 
anticorps selon l'invention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologie liee a une infection par Streptococcus, 

25 par exemple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compost avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon l'invention et/ou administration dudit compose a 
un animal transforme selon l'invention ; 
30 b) determination de la capacite dudit compost k se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transform^ les pathologies liees 
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a une infection par Streptococcus , par exemple Streptococcus agalactiae ou un de ses 
micro-organismes associes. 

Les cellules et/ou les animaux transformes selon Pinvention, pourront 
avantageusement servir de module et etre utilises dans des procedes pour etudier, 
5 identifier et/ou selectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggravees par Streptococcus agalactiae, ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules hotes transformees, 
notamment les bacteries de la famille des Streptococcus dont la transformation par un 
vecteur seion Y invention peut par exemple accroiire ou irthiber son pouvoir irifectieux, 
10 ou moduler les pathologies habituellement induites ou aggravees par Pinfection, 
pourront etre utilisees pour infecter des animaux dont on suivra F apparition des 
pathologies. Ces animaux non transformes, infectes par exemple avec des bacteries 
Streptococcus transformees, pourront servir de module d'etude. De la meme maniere, 
les animaux transformes selon F invention pourront etre utilises dans des procedes de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues a 
Streptococcus. Lesdits procedes utilisant lesdites cellules transformees et/ou animaux 
transformes, font partie de F invention. 

Les composes susceptibles d'etre selectionnes peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques deja connus, ou des composes organiques nouveaux 
elabor£s k partir de techniques de modelisation moleculaire et obtenus par synthese 
chimique ou biochimique, ces techniques etant connues de 1'homme de Tart. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler Finfection par ces micro-organismes. Lesdits composes 
selon Finvention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de Fhomme de Fart. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter et/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viability dudit micro- 
organisme. 
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Cette modulation peut etre realisee par exemple par un agent capable de se Her a 
une proteine et ainsi d ! inhiber ou de potentialiser son activity biologique, ou capable de 
se lier a une proteine membranaire de la surface exterieure d'un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule hote ou de favoriser 
5 Taction du systeme immunitaire de 1'organisme infecte dirige a Pencontre dudit micro- 
organisme. Cette modulation peut etre egalement realisee par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
par exemple l'expression d'un polypeptide dont Pactivite biologique ou structurelle est 
neeessatre a la croissance ou a ia reproduction dudit micro-organisme. 

10 On entend designer par micro-organisme associe dans la presente invention, tout 

micro-organisme dont l'expression de gene peut etre modulee, regulee, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre egalement module 
par un compose de Pinvention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucleotidiques ou des polypeptides selon Pinvention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucleotidiques 
identiques ou homologues a celles de Tinvention et pourront egalement etre detectes 
et/ou identifies par les procedes ou kit de detection et/ou d' identification selon 
Pinvention et egalement servir de cible pour les composes de Pinvention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

LMnvention concerne les composes susceptibles d'etre s6lectionn6s par une 
methode de selection selon Pinvention. 

L' invention concerne egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon Pinvention ; 

b) un polypeptide selon Pinvention ; 

c) un vecteur selon Pinvention ; 

d) un anticorps selon Pinvention ; et 

30 e) un compost susceptible d'etre s£lectionn6 par une methode de selection selon 
Pinvention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La presente invention concerne en outre une composition pharmaceutique selon 
Tinvention pour la prevention et le traitement d'une infection par une bacterie 
appartenant a Tespece Streptococcus agalactiae. 

La presente invention concerne en outre une composition pharmaceutique selon 
5 Tinvention, caracterisee en ce qu'elle comprend des anticorps dirig£s contre les 
polypeptides specifiques de Streptococcus agalactiae. 

On entend designer par quantite efficace, une quantite suffisante dudit compose 
ou anticorps, ou de polypeptide de Tinvention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d r un micro-organisme associe. 
10 L'invention concerne aussi une composition pharmaceutique selon Tinvention 

pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

L'invention vise en outre une composition immunogene et/ou vaccinale, 
caracterisee en ce qu'elle comprend un ou plusieurs polypeptides selon Tinvention et/ou 
15 un ou plusieurs polypeptides hybrides selon Tinvention. 

LMnvention comprend aussi Tutilisation d'une cellule transformee selon 
Tinvention, pour la preparation d'une composition vaccinale. 

L'invention vise egalement une composition vaccinale, caracterisee en ce qu'elle 
contient une sequence nucleotidique selon Tinvention, un vecteur selon Tinvention 
20 et/ou une cellule transform^ selon Tinvention. 

L'invention concerne en outre une composition immunogene capable d'induire 
une reponse immunitaire cellulaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a Tespece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon Tinvention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de Timmunite appropries. 

L'invention concerne egalement les compositions vaccinales selon Tinvention, 
pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

Tinvention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions immunogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant & une 
protdine, ou un de ses fragments, de Tenveloppe cellulaire de Streptococcus. Les 
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compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preference egalement des sequences nucleotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une proteine, ou un de ses fragments, de Penveloppe 
cellulaire de Streptococcus. 
5 Les polypeptides de l'invention ou leurs fragments entrant dans les compositions 

immunogenes selon l'invention peuvent etre selectionnes par des techniques connues de 
l'homme de Tart comme par exemple sur la capacite desdits polypeptides a stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d-interieukines, ou qui abeutit a la production d'aniicorps diriges contre iesdits 
1 0 polypeptides. 

Chez la souris, chez laquelle une dose ponderale de la composition vaccinale 
comparable a la dose utilisee chez Phomme est administree, la reaction anticorps est 
testee par prelevement du serum suivi d'une etude de la formation d'un complexe entre 
les anticorps presents dans le serum et Pantigene de la composition vaccinale, selon les 

1 5 techniques usuelles. 

Selon l'invention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas echeant, avec un 
ou plusieurs adjuvants de Pimmunite appropries. 

Aujourd'hui, divers types de vaccins sont disponibles pour proteger Phomme 

20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-organismes inactives (virus de la grippe), des extraits 
acellulaires {Bordetella pertussis pour la coqueluche), proteines recombinees (antigene 
de surface du virus de Phepatite B), des polyosides (pneumocoques). Des vaccins 
prepares a partir de peptides de synthese ou de micro-organismes genetiquement 

25 modifies exprimant des antigenes heterologues sont en cours d' experimentation. Plus 
recemment encore, des ADNs plasmidiques recombines portant des genes codant pour 
des antigenes protecteurs ont ete proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code uniquement pour la proteine vaccinante. 

30 Des animaux ont ete immunises en injectant simplement PADN plasmidique nu dans le 
muscle. Cette technique conduit a Pexpression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est Pun des principaux avantages de la 
technique de vaccination avec de PADN nu. 
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Les compositions vaccinales comprenant des sequences nucleotidiques ou des 
vecteurs dans lesquels sont inserees lesdites sequences, sont notamment decrites dans la 
demande Internationale N° WO 90/11092 et egalement dans la demande internationale 
N° WO 95/1 1307. * 
5 La sequence nucteotidique constitutive de la composition vaccinale selon 

Tinvention peut etre injectee a Thote apres avoir ete couplee a des composes qui 
favorisent la penetration de ce polynucleotide k Tinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsules dans des 
rnicrGpartieules polymeres, eomrne dccrit dans la demande internationale N° WO 

1 0 94/27238 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
Tinvention, la sequence nucleotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucleaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

1 5 cellules. Le polynucleotide ou le vecteur selon Tinvention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement & la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande internationale N° WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon Tinvention, placee sous le controle d'elements de regulation 
permettant son expression chez Thornme ou T animal. On pourra par exemple utiliser, en 
tant que vecteur d'expression in vivo de Tantigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vehicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui perrnet par exemple la 
facilitation de Tadministration du compose actif, Taugmentation de sa duree de vie et/ou 
de son efficacite dans Torganisme, Taugmentation de sa solubilite en solution ou encore 
Tameiioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 
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bien connus et seront adaptes par Thomme de l'art en fonction de la nature et du mode 
d'administration du compose actif choisi. 

En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de l'immunite appropries qui sont connus de Thomme de Tart, comme par 
5 exemple Thydroxyde d'aluminium, un reprSsentant de la famille des muramyl peptides 
comme un des derives peptidiques du N-acetyl-muramyl, un lysat bact£rien, ou encore 
F adjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie syst^mique, en 
partieulier par voie intravemeuse, par 'voie intranrascalaire, intradennique ou sous- 
10 cutanee, ou par voie orale. De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides selon Finvention, sera administr^e a plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d'administration, posologies et formes galeniques optimaux 
peuvent etre determines selon les criteres gen^ralement pris en compte dans 
15 Petablissement d'un traitement adapte a un patient comme par exemple Fage ou le 
poids corporel du patient, la gravite de son etat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, Finvention comprend Futilisation d'une composition selon Finvention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus. 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
genomique d'une bacterie du genre Streptococcus, de maniere preferee, Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en partieulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre clonees dans ladite banque, en raison de problemes 
de letalites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifiees par Fhomme du metier, en utilisant des oligonucleotides specifiques des 
30 sequences des extremity des differents clones qui forment les contigs. 

La presente invention concerne egalement les m&hodes pour Fisolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN bas6e par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 
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La methode selon l'invention pour 1'isolement d'un polynucleotide d'interet peut 
comprendre les Stapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bacterie Streptococcus, 
ladite bacterie Streptococcus appartenant a une souche differente de la souche 
utilisee pour la construction de la banque d'ADN de l'etape a) ou, de fa$on 

-alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare a 
partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d'ADN de l'etape a) ; 

c) hybrider le polynucleotide de l'etape a) au polynucleotide de l'etape b) ; 

d) selectionner les polynucleotides de l'etape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de l'etape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de l'etape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de fa^on optionnelle, 
Pamplification de 1' insert polynucleotide qui en resulte. 
20 Ainsi, la m6thode de l'invention permet k 1'homme du metier d'effectuer des 

Etudes genomiques comparatives entre les differentes souches ou espdces du genre 
Streptococcus, par exemple entre les souches pathogeniques et leurs equivalents non 
pathog6nes. 

En particulier, il est possible d'etudier et de determiner les regions de 
25 polymorphisme entre lesdites souches. 

L'invention comprend aussi un procede ^identification de sequence specifique 
de Streptococcus agalactiae, caracterise par Talignement de sequences nucl£otidiques 
de Streptococcus agalactiae selon ^invention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

30 

La presente invention concerne egalement l'utilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence, 
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- pour le contrdle par P intermediate du quorum-sensing, 

- pour T identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour 1'identification de cibles contre les bacteries Gram positives pathogenes 
5 par la methode de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 

EXEMPLES 

Exemple I : Materiel s et methode 

10 La strategic de sequen9age du genome de Streptococcus agalactiae CIP 82.45 

(ATCC 12403) repose sur un sequenfage alleatoire (shot-gun). La premiere etape de ce 
travail consiste a doner PADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAC). 
Materiels et methodes. 

15 1 . Construction des banques : 

dJ Banque de petits fragments dans le vecteur pcDNA2. 1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement a 
la proteinase K et une extraction au phenol (9). Environ 10 |ig d f ADN ont ete cassis par 

20 n^bulisation (1 minute sous une pression de 1 bar) (4). Les extremites des fragments 
d'ADN ont ete rendues franches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzyme a 
ete inactivee par une incubation de 15 mn a 75°C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 d'ADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont ete 
purifies apres dlectrophorese sur gel d'agarose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete digere par l'enzyme BstXl et purifie par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4. Le 

30 melange de ligation a ete introduit par transformation dans la souche (^Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par \i\ du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
d£posee a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evenements de co-ligation et de clones 
sans insert, la m^thode du remplissage partiel du site de coupure a ete utilisee (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete digere de maniere partielle par l'enzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de l'enzyme. La fraction presentant la gamme 
de tailles souhaitee (entre 2 et 12 kbases) a ete precipitee et les extremites ont ete 
remplies partiel lement par le fragment de Klenow de la DNA polymerase d'E. coli en 
presence de dTTP et dCTP. Apres purification sur gel d'agarose les fragments d f ADN 
cliromosomique ayant une tattle comprise entre 3 et 6 kbases ont ete iigu^s au vecteur 

1 0 pS YX34 (7) digere par l'enzyme Sail remplie partiellement par l'enzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche <5! Escherichia coli XLlO-kan (Stratagene) et etalement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/1. Environ 500 colonies 
sont obtenues par \x\ du melange de ligation. 

15 2. Preparation des plasmides et sequengage 

Les plasmides ont ete prepares par une methode semi-automatique de 
preparation developpee au laboratoire GMP base sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du fournisseur (PE- 

20 biosystems). Les sequences ont et6 determinees en utilisant tin sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 

Les sequences ont 6te assemblies en utilisant l'ensemble de logiciel 
developpe a l'Universite de Washington, Phred, Phrap et Consed (5, 8). La finition de la 

25 sequence a et€ realisee en utilisant l'ensemble de logiciel GMPTB (7). L'etape de 
finition correspond au resiquenfage des regions ou la sequence est peu sure et le 
s£quen9age des regions situees entre les contigs. Elle a ete realisee en s6quen?ant des 
produits de PCR correspondant a ces regions identifiees par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete definies 

30 en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 

^identification des phases codantes (CDS) a ete realisee en utilisant 
Tensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les r&sultats de differentes methodes : (i) Identification de phases ouvertes de lecture et 
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leur tri en fonction de leur taille, (ii) l'analyse de la probability d'etre codante en utilisant 
le logiciel Genemark (11), (iii) Identification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarity de la sequence proteique 
deduite avec les sequences prot6iques contenues dans les banques de sequence en 
5 utilisant le logiciel BLASTP. 

Les fonctions des proteines codees par les phases codantes identifiees 
indiquees au tableau 1 ont ete predites par l'analyse des r^sultats de recherche de 
similarites dans les banques en utilisant le logiciel BLASTP (1). 

Exemple 2 : Description scientifique de la barique de B AC de Streptococcus agalactiae 
10 CIP 82.45 (ATCC 12403) deposee a la CNCM le 28 d^cembre 2000 sous le numero I- 
2610. 

Collection de clones ^Escherichia coli DH 10B™ (Calvin et al., J. Bacteriol. 
170, 2796, 1988) contenant des fragments d'ADN g6nomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

15 vecteur pSYX34 (Xu et al., Biotechniques, 17:57, 1990). Le vecteur a ete digere Sail et 
partiellement rempli a l'aide de TADN polymerase afin de produire des extremites 
5 9 -TC. Des fragments gdnomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont ete digeres partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5 5 -GA. Apr6s 

20 ligature in vitro et transformation, des clones resistant au chloromphenicol ont ete 
selectionnes. Environ 5000 clones ont ete assembles, suspendus dans 15 ml de milieu L 
et congetes. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM3 16 

Les proteines de surface des bacteries pathog&nes, et plus particulterement les 

25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notamment 
des interactions entre le microorganisme et les cellules de l'hote et/ou Techappement au 
systeme immunitaire. Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularity d'etre ltees covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase-transpeptidase) appelee sortase. L'etude du role de ces 
proteines dans la virulence de S. agalactiae a ete realisee par 2 approches 
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complementaires (construction d'un mutant sortase-deficient, inactivation des genes 

codant pour des proteines de type LPXTG). 

- Le gene srtA de S. agalactiae NEM316 (IPF N°1268). 

Le mutant MEM 1979, depose le 24 avril 2002 a la CNCM sous le numero I- 
5 2861, est une souche mutante derive de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle PIPF 1268 a ete inactive. 

L' analyse du genome de NEM3 1 6 nous a permis de caracteriser un gene srtA 
presentant homologie respect ivement 55 % et 30 % d'identite avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a ete inactive par 
10 insertion-inactivation et nous avons montr6 que le mutant ainsi construit n'adhdrait plus 
a des cellules epitheliales humaines pulmonaires (A549) et uterines (HeLa). Ces 
resultats suggerent que les proteines du type LPXTG de S. agalactiae jouent un role 
dans la virulence de cette bacterie, en permettant notamment son adhesion avec les 
cellules de Thote. 

15 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 1 6. 

Une analyse in silico du genome de NEM316 a revele la presence de 30 
prolines de surface putatives possedant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons 6tudie par amplification PCR, en utilisant des amorces specifiques, la 
distribution des genes codant pour 21 proteines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'hemoculture ou de meningite). Cette etude a montr6 que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient presents dans toutes les souches de 
notre echantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont et£ 

25 inactives par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminuee avec les cellules Epitheliales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle 1TPF 678 a <£t6 inactive 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numero I- 

2863, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1503 a ete inactive. 
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- Cibles vaccinales. 

La presence des gdnes IPF N°1503, 678, 2192, 1861, 584, 280 chez toutes les 
souches de S. agalactiae testees font des proteines correspondantes des cibles vaccinales 
de choix pour le d^veloppement d'un vaccin anti-S. agalactiae. 

TABLEAU 1 : Liste des phases codantes annotees identifies par Panalyse des 
sequences des contigs 
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TABLEAU 2 . Prolines de surface de Streptococcus agalactiae 





SEQID 


N° IPF 


Motif 

LPXTG 


% identite/ similitude 


1 

1 


RRfi 

OOO 


is 


T PHTPt 
Lrn i vj 


zh/o f . oct ^ourid.ce exclusion proicine/ Ju. juecuiis 


2 


386 


1250 


LPSTG 


zz/*ru .octiu ^ouridcc exclusion proicmc^ 

EtfiHZr C/CC/CCmo JtltZlsClllo jpiaollllvl JL/V-/J7 ivl 


■J 






T PKTG 


SO/^S • r\iil1ii1jin?i^p .V nYiPumnYiinp 

J\JI\J~J . UUllUlalluot/ O. jsrIiZUfrllJrIllitZ 


A 






T PATO 


7V//7 1 • dljLUla. 11HC JJlVJlClllC O. LigtilLiLl fl4& 


5 


806 


1716 


LPSTG 


31/46 : M-like proteine 5. equi 


6 


1183 


2140 


LPLTG 


ju/vji/ . V/Cii-ui vimuii piviicjii iiuniuiug ywer x>. suoiiiib 
j*t/jvi . oidgc v opui uictiiviii jjiviiciii £>. nciiuciururio 


7 
/ 


1 ^46 




JL»r XV 1 VJ 


ZJ/JO . VJIJJAJrUWIl xj. rlUiUtiurtlrfo 


Q 
O 


1 Q49 


571 


T PnTPt 
l_/i O 1 VJ 


ju/ov . riciiia^giuiiiiiiie o. guraomi 


Q 

y 


9190 




T Pr\fTO 

ijllN 1 VJ 


98/4^ • cHrr C riufpuc 


10, 


2046 


678 


LPKTG 


57/70 : putative cyclo-nucleotide phosphodiesterase 
oirep. uysgaiaciiae susp. eifUismiiis 


11 ! 


618 i 


1503 


LPKTG 


49/65 : celle envelope proteinase S. thermophilics 


1 9 • 
i Z 


1 997 
1ZZ / 


99ft 


T PnTPt 


jU/4j . ospr> ^aQnesionj o. goraonii 


1 J j 






LrN 1 VJ 


zo/45 . nypomeiicai serine ncne repeat proi o. poitioe 


14, 


1493 


2495 


LPKTG 


23/41 : gene drosophile 


15 


1955 


585 


LPKTG 


30/46 : 6-aminohexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C. elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S, sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 


17 


LPKTG 


30 /47 : hypothetical proteine iota de S. pyogenes 
plasrnidpDBlOl 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasrnidpDBlOl 


22 


1418 


2414 


LPSTG 


33/47 : orfC E.faecalis, plasmid pAM-beta-1 


Autres proteines possibles (IPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B. Halodurans 
29/41 : fimbrial SU Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


24 ' 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L. leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein I 5. pyogenes 
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TABLEAU 3: Liste des phases codantes annot6es identifies par I'analyse de la s6quence gSnomiqufe complete SEQ ID N°2345 | 


Fonctions Predites 


simiiar to glutamyl-amihopeptidase and/or to endo-1,4-beta- 
glucanase 


Unknown ~ ' " | 


similar to unknown protein 


similar to thioredoxin Hi 


weakly similar to phenyjalanyl-tRNA synthetase (beta subunit) 


similar to unknown proteins I 


similar to single-strand binding protein | 


Similar to ABC transporter (ATP-binding protein) | 


similar to unknown proteins | 


Similar to two-component sensor histidine kinase | 


Similar to two-component response regulator | 


similar to unknown proteins j 


similar to unknown proteins 


Similar to (oligopeptide) ABC transporter (binding protein) 


Similar to oligopeptide ABC transporter (permease) 


similar to phosphatidylcjlycerophosphate synthase 


Similar to ABC transporter (permease) | 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Hypothetical protein | 


similar to unknown protein 


similar to unknown protein 


similar to transcription-repair coupling factor ; 


similar to peptidyl-tRNA hydrolase 


similar to unknown proteins j 


similar to hypothetical 03TP binding protein | 


Hypothetical protein 


similar to unknown protein 


similar to putative transcription regulator | 


beta subunit of DNA polymerase III 


Positions / Sens 
(p=plus, m=minus) 


202238-203305 m 


203490-203729 m ! 


203890-204174 p 


204171-204494 p 


204527-205153 p 


205207-205923 m | 


206004-206399 p 


2190539-2191378 m 


206522-207166 p 


207193-208938 p 


208919-209659 p | 


209829-210284 p | 


210286-211014 p 


211257-212885 p 


212998-213975 p 


2191378-2191917 m | 


213972-214793 p I 


214805-215608 p 


215592-216218 p 


10743-10877 p 


10369-10740 p 


10110-10382 p 


6322-9819 p j 


5750-6325 p 


2192043-2193326 m j 


4551-5666 p 


4188-4391 p 


3789-3986 p 


2898-3779 p 


1692-2828 p 


z 

0) 

c 

\l 


SA-1000.1 


SA-1001.1 | 


SA-1 002.1 


SA-1003.1 


SA-1004.1 


SA-1006.1 


SA-1 007.1 


SA-101.1 


SA-1010.1 


SA-1 01 2.1 


SA-1 01 3.1 j 


SA-1 01 6.1 | 


SA-1 01 7.1 


SA-1018.1 : 


SA-1 01 9.1 


SA-1 02.1 | 


SA-1 020.1 


SA-1 021.1 


SA-1022.2 | 


SA-1 024.2 | 


SA-1 025.2 


SA-1 026.1 


SA-1 028.1 


SA-1 029.1 ! 


SA-1 03.1 ! 


SA-1030.1 


SA-1 031.1 


SA-1 032.1 


SA-1033.1 


SA-1034.1- i 


Anciens 
SEQ ID 
(Proline) 


CN 


CO 
N* 




m 


CO 


N" 


oo 


CO 


o 

to 


IO 


CN 

m 


ID 


in 
m 


CD 

m 


h- 
m 


OO 
IO 


Ol 

in 


o 

CD 




CO 
CO 


CD 


in 

CO 


CO 
CO 


t~ 

co 


oo 

CO 


CD 
CO 


o 
r~ 


t-- 


CM 


CO 


SEQ ID 
(Proline) 


2346 


2347 | 


2348 


2349 


2350 


2351 | 


2352 


2353 


2354 


2355 


2356 ! 


2357 I 


2358 i 


2359 ' 


2360 


2361 


2362 


2363 


2364 


2365 


2366 


2367 


2368 


2369 j 


2370 j 


2371 


2372 


2373 


2374 


2375 


SEQ ID (ADN) 


SEQ ID n° 4482 


|SEQ ID n° 4483 I 


SEQ ID n° 4484 


SEQ ID n° 4485 


SEQ ID n° 4486 


|SEQ ID n° 4487 | 


|SEQ ID n° 4488 


o> 
oo 

o 
C 

Q 

O 
UJ 
CO 


|SEQ ID n° 4490 


|SEQ ID n° 4491 


|SEQ ID n° 4492 


CO 
05 

N" 
o 
C 

Q 
O 

LU 
CO 


|SEQ ID n° 4494 


|SEQ ID n° 4495 


SEQ ID n° 4496 


|SEQ ID n° 4497 


SEQ ID n° 4498 


SEQ ID n° 4499 


SEQ ID n°4500 


SEQ ID n" 4501 


|SEQ ID n° 4502 \ 


|SEQ ID n° 4503 


SEQ ID n° 4504 


|SEQ ID n°4505 


|SEQ ID n° 4506 | 


|SEQ ID n°4507 


SEQ ID n°4508 


o> 
o 
to 

o 

c 
o 

O 
UJ 

CO 


o 
in 

o 
C 

Q 

O 
UJ 

CO 


|SEQ ID n°4511 



WO 02/092818 



349 



PCT7IB02/03059 



CM 
LO 
CO 
O 

i 



CM 



O 

Q_ 

to 
c 

2 

■4-» 

o 
m 
< 
o 

jo 
E 



CL Q_ 



co 



X 

o 

CO 

V 

CD 



CO 

to 

O 

o 
_3 

O) 

8 

CO 



CL 
Q 

o 
I 



CD 
CO 
i 

CO 

in 

CM 
CD 
GO 



m 

s 

i 



CO 

oo 



OO 
CO 
CM 



CM 
LO 



8. 



CL 
CO 

oo 
o> 

CO 
CO 

o 

CO 
CO 

oo 



CL} 
lO 

o 
o 

CD 
i 

N 
lO 

CO 
CD 
CO 



GO 

2 
£ 

co 
c 

2 

CD 

"S 

Q? 

CO 
-C 
CL 
00 
O 

_c 

CL 



CL 

m 
o 
o 
h- 
o 

<f 

CO 
CD 
CO 

in 
o 

CD 



>-» 

e 1 

CD 

~a 

CO 

52 

CO 

cx 
to 

Q 



CL 
CO 
CM 

T — 

CO 

o 

CD 
■ 

m 

CD 
CD 



CD 



s 



s 



CO 

to 

0) 

c 

>% 

(D 
O 

*JQ 

CD 

c 

*E 

CO 



13 
CL 



0) 

9 

CL 

CD 

O ' 
O ' 

E 



CL 

o 

o 
m 

CD 



o 

3 



CD 
CD 
O 

5 

CO 



m 
o 

CM 



in 
o 



CM 



"3" 

in 



CM 



CO 



CN 



a 

LU 

CO 



o 

LU 

CO 



WO 02/092818 



350 



PCT/IB02/03059 

























c 


















ase 






2oR family) 


zyme | 




ns isomerase j 




tidine kinase 
















to 










ing protei 


ing protei 










lavoprotei 






uctase 




protein 




zyme IIC 


zyme IIB 


hydrogen 


zyme IIA 


regulator 


vating en 


CO 


ilyl cis-tra 


egulator 








CO 
m 






































ie cleavage system H 




c 


c 




c 


thetical transcriptional 






CL 


CJ 




CO 

1c 

o 
to 
c 

0) 
CO 
•*—» 

c 

c 
o 

CL 

E 

8 














porphyrinogen oxida: 


own protein 


methyltriansferase 


bwn profein 


own protein 


transporter (ATP-bin 


transporter (ATP-bin 




phoglucomutase 


criptional regulator 


own protein 


)thenate| metabolism 


protein 


own protein 


H-depertdent oxidore 


own profein 


own profein 


a) 
CO 

o 
i*= 

"o 

(D 
Cl 
CO 

a> 

CO 

o 

lo 


0) 
CO 
1— 
CL 

O 

O 

a> 

CL 
CO 
1 

CD 
CO 

o 


ne monophosphate d 


biose-specific PTS e 


criptional regulator ([ 


/ate formate-lyase ac 


ral stress protein GS 


part similar to peptidyl-pi 


compone)nt response 


own proteins 


lasmid proteins 


ine repressor (ArgR) 


thetical protein kinasi 


• proteins 


INA-binding protein Sun 


t tRNA formyltlransferase 


roto 


nkn 


oxy 


nkn 


nkn 


BC 


CO 




hos 


sue. 


nkn 


ante 


avo 


nkn 


IAD 


nkn 


lycii 


nkn 


o 

8 


O 

s 


IjSOl 


o 

8 


ypo 


trans 


yru\ 


ene 


tWOH 


tWOH 


nkn 


rgin 


ypo 


thei 


CL 




■a 


>=> 




< 






CL 




3 


CL 


u— 


3 






CO 














CL 


CO 


CO 

d 




CL 




x: 


o 


LL 


o 








3 


o 


o 


c 


o 


o 


O 


o 


o 


O 


o 


o 


o 


2 


O 


o 


a 


3 


o 


2 


a 


2 


o 


O 


O 


O 


a 


o 


o 


O 










|8 








$ 
o 


' 


-•— ' 




» 




































-♦-» 




■♦— * 






c 


4— 


k. 


<D 














i_ 






t 


I— 








ilar 


ilar 




ilar 




i— 






"E 


ilar 


ilar 




i_ 




i— 






hio 


co 


J3 






S 




c 


jo 


J5 






CO 


_ro 


JO 


TO 




_C0 










CO 


k— 

0) 

v 




CO 


TO 


CO 




m 


E 


E 


serir 


E 


£ 


E 


E 


nk 


E 


E 


E 


£ 


E 


ILUjS 


E 


E 


E 


E 


E 


E 


1 


E 


E 


E 


£ 


E 


E 


E 


E 


E 


E 


E 


E 


E 




CO 


LO 


CO 


CO 


CO 


CO 


ZD 


CO 


CO 


CO 


CO 


CO 


(0 


CO 


CO 


CO 


fr\ 
\J) 


f r\ 
\f) 


CO 


UJ 


CO 


CO 


CO 


CO 




Uj 




CO 


CO 


CO 


CO 


CO 


CO 


c 

L_ 


E 


E 


E 


E 


£ 


E 


E 


E 


CL 


E 


CL 


CL 


CL 


E 


E 


E 


E 


E 






E 




















E 


E 


























m 






CO 














CL 






n 


CL 


CL 


E 


CL 


CL 


CL 




CL 






CL 


CL 


CL 


CI 


CD 


h— 


CO 


CO 


CO 


m 


CO 


CO 


CM 




in 


CO 




CO 




CO 


CO 






CM 




CO 


LO 


CO 


co 


CO 


CM 


o 


CO 




CO 




CM 


CO 


o 


xf- 


CO 


m 


CO 


CO 


CM 


I s - 


CO 


I s - 




o 






CO 


CO 










CO 


CM 


I s - 




h- 


CO 


o 


xr 


T"" 




m 


CO 


o 


CO 


CO 


CO 


CO 


CO 


o 




CO 


CJ> 


CO 


O 


CO 


5? 


co 


CO 


CO 


LO 


CO 




CO 


CO 


CO 


CO 


o 


CM 




CO 


00 






o 


CO 


CO 




in 


xr 


CO 


I s - 


T— 


In 


o 


o 






CO 


CO 




CO 


CO 


o 


in 




in 


r--. 


CO 


CO 


CM 


CM 


xr 


o 


-Sj- 

cd 

CO 




CO 


CO 


CD 


to 


CO 


m 


in 


m 


m 


m 


m 


CO 


in 




m 


m 












CO 


CO 


CO 

5 


in 

•^f 




CO 


CM 


CM 
<^ 


o 
X* 


O 

xr 


CO 

CO 


CO 

o 


o 

CM 
CM 


co 
co 


in 

CO 


xr 

CO 






































CO 

i 


CO 

i 


CM 


i 


CO 
1 


CO 

i 




CO 
1 


CO 
1 


CO 
1 


cp 


CO 


CO 
1 


CO 

i 


CO 
1 


CO 
1 


i 

o 


» 


■ 

CO 


• 


i 

I s - 


■ 


i 

Q 


■ 

CO 


r- 


i 

o 


LO 


r- 


00 


i 

CO 


i 

CO 


1 

CO 


i 

CM 


■ 


o 


00 


i 


CO 




r- 


i 

o 


I s - 


LO 


CM 


o 


CO 


• 

CO 


LO 




I s - 


I s - 


CM 


CO 


5 


m 


I s - 


CO 


co 


o 


CO 


o 


T— 


CM 


CO 


m 


CO 


t^- 


CO 


CO 


CM 


o 






CO 


LO 




CO 


I s - 


r-- 


CD 


co 


CO 




CO 




co 


I s - 


in 


o 


in 




T— 


in 


CO 




CO 




CM 


xf 


CO 






CO 


CO 


CO 


CO 




o 


5 


r^- 


in 


CO 


r- 


co 


CO 


CM 


CM 


in 




LO 


xr 


I s - 


co 


xr 




o 


CO 


CO 


I s - 


in 




CO 


CM 


I s - 




o 


o 


CO 




CO 


CO 


m 


CO 


CO 




in 




CO 


CM 


CM 


o 


O 


CO 


CO 




CO 


CO 


m 


xr 


CO 


CO 


CO 


in 


in 


LO 


in 


s 


m 


in 


CO 


LO 


m 


m 








rr 




CO 


s 


CO 


s 


CO 




co 


S 


s 




CO 
CO 


CO 
CO 


CO 

o 


CO 


CO 
CO 


CO 
CO 


CO 
CO 


CO 
CO 










































CM 




















CM 




















T — 




CM 








r— 












CM 


CM 








CM 


CM 






T — 


















xr— 




CM 


CO 


xj- 


in 


CO 


I s - 


CO 


CO 


ob 


o 




CM 


co 




iri 


CO 




CO 


CO 


CO 


o 




CM 


CO 




LO 


CO 


1^ 


CO 




O 


o 




CM 


CO 




I s - 


i*— 


h- 


I s - 


I s - 


r- 


r- 


I s - 


CO 


GO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 






o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


O 


o 


o 


O 


o 


o 


o 


o 


o 


o 




























x— 




i 






















■ 




















| SA- 


1 SA-' 










< 




5 


< 


< 


< 


5 


1 

< 




SA 


< 


< 




I 




< 


1 

< 


< 


1 

< 


< 


SA 


< 








i 


1 

< 


1 

< 


1 

< 


< 


1 

< 


< 


t 

< 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


o 




CM 


CO 




in 


! 

CO 


I s - 


CO 


CO 


o 


T— 


CM 


CO 




m 


CD 




CO 


CO 


o 




CM 


CO 


a 


m 


CO 


r- 


CO 


CO 




CM 


CO 




in 


CO 


▼» 


















1 — 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


CO 


co 


CO 


CO 


CO 


CO 


CO 


CO 


? 


S 




xr 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CN 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 




CM 


CM 


O 




CM 


CO 


xf 


m 


co 


I s - 


CO 


CO 


o 




CM 


CO 




m 


CD 




CO 


CO 


o 




CM 


CO 




m 


CO 


I s - 


CO 


CO 


O 


x— 


CM 


CO 


xr 


in 






















CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


CO 


CO 


co 


CO 


CO 


CO 


CO 


CO 


xr 


xf 


XT 




xr 






xT 




xr 








5r 


xr 




xr 




x* 


■*r 












"d- 












xr 






xr 


xr 


xr 


xr 


xr 


xr 


NT 




CM 


CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 




CO 


CO 


O 




CM 


CO 


xr 


m 


CO 


I s - 


CO 


CO 


o 




CM 


CO 




in 


CO 




CO 


CO 


o 




CM 


CO 




m 


CO 




CO 


CO 


O 


^ — 


s 






xr 


in 


m 


m 


m 


m 


m 


in 


m 


in 


in 


CO 


CO 


CD 


CD 


CO 


CO 


CO 


co 


CD 


CO 


I s - 


I s - 


I s - 


I s - 


I s - 


I s - 


r- 


I s - 


I s - 


r- 


CO 


GO 


m 


in 


in 


m 


m 


m 


in 


in 


in 


tn 


LO 


in 


in 


in 


in 


m 


in 


m 


m 


in 


in 


in 


m 


m 


LO 


m 


LO 


m 


m 


m 


LO 


m 


m 


in 


in 


xr 










xt 


xr 


xr 


XT 




xT 


xr 


xf 
















<<3- 










xf 




xr 




xr 


xr 


xf 


xj- 


xj- 


xr 


xT 


o 


o 


o 


o 


o 


o 


a 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


0 


o 


C 


C 


C 


c 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


c 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


c 




C 


C 


C 


c 


CZ 


C 


Q 


O 


Q 


Q 


Q 


Q 


Q 


a 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


a 


Q 


Q 


Q 


Q 


Q 


O 


Q 


a 


Q 


Q 


Q 




Q 


Q 


Q 


O 


O 


o 


O 


a 


a 


O 


a 


a 


O 


O 


O 


O 


O 


O 


o 


O 


O 


a 


O 


a 


O 


a 


O 


O 


O 


a 


O 


o 


O 


O 


o 


O 


O 


O 


a 


a 


UJ 


UJ 


UJ 


DJ 


LU 


LU 


LU 


UJ 


UJ 


UJ 


LU 


UJ 


UJ 


LU 


LU 


LU 


LU 


UJ 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


co 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



WO 02/092818 



351 



PCT7IB02/03059 











































CD 






CD 




CD 






CD 


i itn 


















































E 






E 




E 






E 


)arin 


















































N 










M 






& 


















































C 






c 




c 






c 


CD 
JC 


















































a> 






CD 




CD 






CD 










z 












O 












tein 
















E 






E 




£ 






E 


E 
—i 










c 












CD 


























£ 






£ 










£ 










CD 












=> 












p 
















"to 






"to 




"to 






to 


Flavobacterii 










somal prot 








ine kinase 


/Fnr family 


iponse reg 


g protein) 


rmease) 


Dse operor 




nease) 


-binding pi 


lease) 


ing protein 












fic PTS sy 






fic PTS sy 




fic PTS sy 






fic PTS sy 


1 family) 




/Fnr family 


uperfamily 


o 








■o 


Q. 


onentres 


c 


CD 








CL 
















o 






o 




o 






o 


o 




CL 


CO 


Y (prim 




ase 


inosucciniate synthase 


sor histi 


ator (Cr 


transporter (ATP-bindi 


jorter (p 


sor of ri 1 




rter (pei 


rter (AT 


rter (pei 


rter (bin 






ury(ll) reductase 




RadA 


ine-spe 




m 


ine-spe 




ine-spe 






ine-spe 


se from 


ator (La 


flase 


ator (Cr 


cilitator 


plication factor 


own proteins 


£ 

to 

c 

8 

to 
o 
c 


component sen 


criptional iregui 


similar to two-comp 


ive ABC tj-ansp 


cription repres: 


inase 


e ABC transpo 


e ABC transpo 


e ABC transpo 


e ABC transpo 


own proteins 


synthetase 


)nic anhy^rase 


repair protein 1 


etylgalactosam 




ironyl hycfrolasi 


etylgalactosam 




etylgalactosam 




ine deiminase 


etylgalactosam 


ritin-sulfate lya 


criptional regul 


leptide deformj 


CO 
CO 

c 
o 

CL 

o 


ease (major fa 


somal re 


unkn 


argin 


argin 


two-c 


trans 


ABC 


putat 


trans 


ribok 


ribos 


ribos 


ribos 


ribos 


unkn 


tRNA 


mere 


carbc 


DNA 


N-ao 




— > 

o 
=> 

CO 


N-ao 




N-ac 




argin 


N-ao 


hepa 


trans 


polyp 


trans 


perm 


o 


o 


o 


o 


o 


o 


o 


O 


o 


o 


o 


o 


o 


o 


o 


! 


o 


o 


o 


o 




o 


o 




o 




O 


o 


o 


o 


o 


o 


o 




l. 




t_ 










i_ 










i_ 


&_ 


lutamj 


v_ 






w 














i_ 






l_ 




i— 




O 


TO 


JS 


to 


JS 


03 


JS 


JS 


to 


to 


_co 


is 


is 






to 


TO 


i5 










is 




_m 




J5 


iS 


ro 


j5 




m 


is 


E 


JLUI 


;uii 


jLUj 


jUJ! 


imi 


ILUI 


IWj 


imi 


jUJ! 


ILUI 


luui 


E 


I ill! 


jUII 


|UJl 


joi; 


*§ 


E 


M < 


jlU! 


*§ 


<c 










c: 




£ 


E 




Q_ 


to 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


to 


CO 


CO 


CO 


— 


CO 


to 


CO 




CO 


CO — 


CO 


CO 


CO 


CO 


CO 












E 




















D_ 












E 


E 




E 




E 


CL 


E 


E 


E 


Cl 


CL 


E 


o_ 
m 


Q_ 
t — 


6p 


Ql 
CD 


dg 


o 

CO 


;2p 


10 p 


Q_ 

S 


E 


E 
in 


E 
o> 


E 
in 


E 
m 


E 


CM 
h- 


CL 
CO 


'0 p 


Q. 

r^- 


Q. 




CM 


m 
h- 




CM 




s: 

CO 


I s — 


T— 


CO 


CM 
CD 


o 

CO 


O 


in 


o 




o) 


CO 






GO 


oo 


CM 




in 


co 




CO 


CD 


o 


CM 


CO 






CD 








CO 




o 










CD 




CD 




r- 




o 


CO 


CO 


CO 


I s - 


I s - 


CO 




CO 


CO 




CO 


CO 


CO 








CO 




CM 






CO 




o 


CO 


I s - 


CD 


m 


CO 


O 


CO 




o 


o 


CO 


CO 


I s - 


CO 


in 






CM 




O 


O 


CO 




h- 




CO 


co 




CD 




CD 


o 


CD 


CO 


in 


m 


in 


in 


CO 


CO 


m- 






CM 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CM 


CO 


CN 


CM 


CM 




CO 


CO 




CO 




CO 


CM 


CO 


CO 


CO 


CO 


CO 


CO 


CO 
1 


CO 
• 




1 


• 


CM 


r— 
i 


1 


i 














^ 


i 


^ — 


-t — 
i 


i 
















CM 








i 


i 




lO 


o 


CO 


CO 


m 


O 






CO 


■ 

oo 


i 


i 


1 

I s - 


• 


1 

CO 


CO 


CO 




O 


O 




oo 


1 

CO 




o 




CO 


CO 


1 

CD 


CM 


i 


CO 


CD 


i 




CO 


o 


CO 


r- 


CO 




CD 


o 


co 


CO 


CO 


CO 




o 


CO 


o 


CO 


CO 


CO 










CO 




CM 


CO 


CM 




CD 


I s - 


CD 


CO 


o 


CO 

o 


CO 


in 
o 


co 
o> 


o 
o 


CO 


CO 

h- 


CO 
CO 


m 


CO 




CO 
CM 


s 

CM 


o 


CO 

o 


m 

CO 


CO 

h- 


CO 

h- 


CO 

in 




CD 
CO 






CO 




o 


CO 


CM 
O 


CM 
CO 


I s - 


3 


r- 

LO 


5 


CO 


CO 






CO 


o 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


o 


CM 


CM 


CM 


CM 




CO 


CO 




CD 




5 


o 


CD 


m 


LO 


in 


in 


m 


co 


CO 








CM 








T— 










■f 


CM 
CM 












CO 


CO 




CO 




CO 


CM 


CO 


CO 


CO 


CO 


CO 


CO 












CM 




































T— 






CM 












r— 




CM 


CM 


































CM 




CM 


CM 




T— 




^_ 










T — 






i 


in" 




CO 


o> 




o 




CM 


CO 




m 


CO 


CO 


CO 


CM 


O 




CM 


CO 




iri 


CO 




h- 




CO 


CO 




CM 




iri 


CD 


1^ 




o 


o 


o 


o 






















CM 


CM 


CM 


CM 




CM 


CM 




CM 




CM 


CO 


CO 


CO 


CO 


CO 


T- 






T— 












T— 










































T — 


















SA-' 




















SA-' 
























T— 




1— 










1 

< 


-4 


< 






< 










< 








i 

< 


< 


< 








< 




J- 






< 

CO 


1 

< 


<i 






i 

< 


i 

< 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 




CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


I s - 


CO 


Co 


o 




CM 


CO 


s 


m 


CO 


I s - 


CO 


CO 


o 




CM 


CO 


3 


m 


CO 




CO 


CO 




o 






CM 


CO 




in 


CO 


I s - 


CO 








m 


m 


m 


m 


in 


m 


m 


m 


m 


CD 


s 


CO 


CO 


CO 


CO 




CO 


CO 










I s - 


I s - 




I s - 


I s - 


I s - 


I s - 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 




CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CO 


I s - 


CO 


CO 


O 




CM 


CO 


s 


in 


CO 


h- 


CO 


CO 


o 


i — 


CM 


CO 


s 


in 




CO 


I s - 




CO 




CO 


O 




CM 


CO 




in 


CD 










in 




m 


m 


m 


m 


in 


in 


m 


CO 


CO 


CO 


CO 


CO 




CD 


co 




CO 




CO 


h- 


I s - 


I s - 


I s - 




I s - 


I s - 


































"4- 














Tj- 




















CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 




CM 


CM 




CM 




CM 


CM 


CM 




CM 


CM 


CM 


CM 


CM 


CO 


S 


m 


CO 


r- 


CO 


CO 


O 




CM 


CO 




m 


CO 




CO 


CO 


O 






CM 


CO 








in 


CO 


I s - 


00 


CO 


O 




CM 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


O 


O 




o 


o 




o 




o 


o 


O 


o 


O 


T— 






m 


in 


m 


in 


in 


m 


m 


m 


m 


in 


in 


m 


m 


m 


m 


in 


in 


in 


CD 


CD 




CO 


CO 




CO 




CO 


CO 


CD 


CO 


CD 


CO 


CO 






*r 


m- 












M" 






































M" 


-^r 


M" 




M" 






o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 


o 




o 


o 




o 




o 


o 


o 


o 


o 


o 


o 


o 


C 




C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


C 


£= 




c 


c 




c 




C 


C 


C 


C 


c 


C 


C 


C 


a 


Q 


Q 


Q 


Q 


Q 


Q 


O 


Q 


O 


Q 


a 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


Q 




Q 


Q 








Q 


Q 


Q 


Q 


Q 


Q 




Q 


o 


O 


O 


O 


O 


O 


O 


a 


O 


o 


a 


a 


O 


O 


O 


a 


a 


O 


O 


a 




o 


o 




o 




O 


a 


O 


O 


o 


O 


O 


O 
LU 


Lit 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 




LU 


LU 




LU 




LU 


LU 


LU 


LU 


LU 


LU 


LU 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 




CO 


CO 




CO 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



WO 02/092818 



352 



PCT/IB02/03059 



similar to oxidoreductasfe | 


similar to endopeptidase* 


similar to unknown proteins 
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Unknown J 


similar to unknown proteins I 


Unknown I 


tryptophanyl-tRNA synthetase I 


similar to probable type II DNA modification enzyme | 


similar to integrase 


similar to unknown proteins f 


similar to unknown proteins | 


similar to Phospho-beta-D-galactosidase [ 


Similar to lactose-specific PTS system enzyme IIBC j 


Similar to lactose-specific PTS system enzyme IIA | 


Similar to transcription antiterminator | 


CD 
10 
CO 

o 
*o 

(0 
0) 

to 
x: 
o_ 

CO 

O 

sz 

Q_ 

? 
CO 

1 

CD 
CO 

£ 

CO 

o> 

CO 

•4— » 

o 

JO 

E 
to 


similar to tagatose 6-pKosphate kinase I 


similar to galactose-6-phosphate isomerase (large subunit) 


similar to galactose 6-P isomerase (small subunit) | 


Unknown 


similar to unknown proteins 


similar to unknown proteins I 


similar to unknown protein [ 


Unknown 


similar to plasmid recombination / mobilization protein 


Unknown I 


similar to plasmid replication protein I 


Unknown 


similar to replication protein (N-terminal part) 


Unknown I 


Unknown I 


(similar to transcriptional regulator I 


similar to integrase 


| ribosomal protein S9 j 


50S ribosomal protein L.13 J 


similar to unknown proteins 


similar to N-acetylglucofeamine metabolism protein I 


similar to other proteins 


similar to coproporphyrinogen III oxidase (HemN) [ 


1372110-1372424 m I 


1372659-1373864 m 


1373916-1374407 m 


2207214-2208239 m 


1374421-1378032 m 


1378369-1379568 m 


1379571-1379888 m \ 


1380538-1381431 m 


1381531-1382937 m 


1383024-1384730 m 


1384730-1385047 m 


1385076-1385909 m | 


1386302-1387282 m | 


! 1387287-1388216 m 


1388229-1388744 m 


1388761-1389186 m 


248617-249024 p 


248225-248515 p 


247430-247717 m 


| 247105-247440 m 


246330-246800 p 


244906-246162 p 


244155-244589 p 


243263-244051 p 


242322-242963 p 


| 241992-242318 p 


241705-241986 p 


241271-241564 p 


| 240555-241106 m 


239332-240486 m ! 


238812-239204 p 


! 238345-238791 p 


j 951207-951863 p 


950447-951217 p 


949709-950446 p 1 


948575-949705 p i 


SA-1 177.1 I 


SA-1 178.1 ! 


SA-1 179.1 


SA-1 18.2 


SA-1 180.2 


SA-1182.1 


SA-1183.1 


SA-1 184.1 I 


SA-1 187.1 | 


SA-1 189.1 


SA-1 190.1 


i SA-1 191.1 


SA-1 192.1 


SA-1 193.1 


SA-1 194.3 


SA-1 195.3 


SA-1 196.2 


SA-1 197.1 


SA-1198.1 


SA-1 199.1 


SA-1201.1 


SA-1203.1 


SA-1 205.1 


SA-1 207.1 


i SA-1208.1 


SA-1209.1 


SA-1210.1 


SA-1211. 1 


| SA-1212.1 


SA-1213.1 


| SA-1214.2 


SA-1215.2 


SA-1216.2 


1 SA-1217.1 


CO 
CM 
i 

< 

CO 


1 SA-1219.1 


CO 

CO 


CO 


CO 
CO 


o> 

CO 


o 

CN 
CO 


CN 
CO 


CM 
CM 
CO 


CO 
CN 
CO 


CN 
CO 


CO 
CM 
CO 


CO 
CM 
CO 


CD 
CM 
CO 


o 

CO 
CO 


CO 
CO 


CM 
CO 
CO 


CO 

to 

CO 


xj- 

co 

CO 


see 


CO 
CO 
CO 


h- 

CO 
CO 


o 

xr 

CO 


CM 
CO 


to 

CO 




LO 

5 


CO 

s 


00 

s 


CD 
CO 


o 
in 

CO 


CO 


CM 

m 
to 


CO 
LO 
CO 


i 354 


IO 
LO 
CO 


CO 
LO 
CO 


LO 
CO 


2512 I 


2513 


2514 


2515 


2516 


2517 


2518 


2519 ' 


2520 i 


2521 


2522 


I 2523 


2524 


2525 


2526 | 


' 2527 


2528 I 


2529 


2530 


2531 


2532 


2533 


2534 


2535 


2536 


2537 


2538 | 


2539 : 


I 2540 


! 2541 


2542 


2543 


2544 


2545 


1 2546 


! 2547 


CO 

I 

o 

cz 
Q 


o> 

CO 
XT 
o 
C 

Q 


o 

LO 
CO 

0 

C 

a 


ID n° 4651 


ID n° 4652 


CO 

LO 
CO 

xr 

o 
C 

Q 


S 

CO 

XJ- 

o 

c 
Q 


LO 
LO 
CO 

xr 

o 
C 

Q 


CO 

LO 

CO 

Xf 

o 

c 
Q 


LO 
CO 
XT 
o 
C 

Q 


CO 
LO 
CO 

XJ- 

o 

c 
Q 


ID n° 4659 


o 

CD 
CO 
xj- 
o 
CZ 

Q 


5 

o 

CZ 

Q 


ID n° 4662 1 


CO 
CO 
CO 

xf 

o 
CZ 

Q 


ID n° 4664 


to 

to 

CO 

xj- 

o 
CZ 

Q 


CO 
CO 

$ 

o 

CZ 

Q 


CO 
CO 
-vT 
e 
CZ 

Q 


ID n° 4668 


ID n° 4669 I 


ID n° 4670 


ID n° 4671 


CM 
CO 

xr 

o 
CZ 

Q 


CO 

CO 
N" 
o 
CZ 

Q 


XT 
CO 

xr 

o 
CZ 

Q 


ID n° 4675 


ID n° 4676 


to 

o 

c 
O 


ID n° 4678 


ID n° 4679 


ID n° 4680 


00 
CO 

xr 

o 
C 

Q 


CM 
CO 
CO 
xT 

o 

tz 
Q 


CO 
CO 
CO 
N" 
o 
£Z 

Q 


ISEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


SEQ 


O 
UJ 

CO 



WO 02/092818 



354 



PCT/IB02/03059 



similar to unknown proteins 


similar to unknown proteins | 


similar to phospho-sugkr mutase I 


Isimilar to unknown proteins | 


similar to unknown proteins j 


similar to unknown protein (to hypothetical UDP-N- 
acetylmuramyl tripeptidje synthetase???) 


similar to other protein^ 


similar to lipoate-proteih ligase A 


50S ribosomal protein 1.17 | 
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similar to folyl-polyglutarjiate synthetase ] 


similar to unknown protein | 


Isimilar to homoserine kinase 


similar to homoserine dehydrogenase 


iSimilar to nickel ABC transporter (binding protein) I 


^Similar to nickel ABC transporter (permease) [ 


Similar to oligopeptide and nickel ABC transporter (permease) 


similar to unknown proteins 


Similar to oligopeptide ^BC transporter (ATP-binding protein) 


Similar to oligopeptide or nickel ABC transporter (ATP-binding 
protein) 


j uridylate kinase | 


ribosome recycling factor 


similar to unknown proteins 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins 


similar to myosin-crossreactive streptococcal antigen (unknown 
function) 


similar to phosphate starvation inducible protein, unknown 
function 


Unknown j 


similar to two-component sensor histidine kinase ! 


similar to two-component response regulator (PhoB) i 


Similar to transcriptional regulator PhoU 


similar to phosphate ABC transporter (ATP-binding protein) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (binding protein) 


similar to single-strand binding protein 


similar to replication protein (plasmid) | 


Unknown 


Similar to unknown proteins | 


Similar to ribosomal protein L11 methyltransferase 


2037692-2038150 m , Similar to unknown proteins \ 


Similar to transcriptional regulators | 


1233381-1 234643 m 


1234645-1235532 m 


1235519-1236385 m 


1236387-1237670 m j 


1647764-1649380 m 


1646833-1647777 m 


1646027-1646833 m 


266230-266436 m 


1645251-1646039 m 


1644584-1645264 m 


1643735-1644463 m 


1643162-1643719 m 


1642190-1643044 m 


1641543-1642052 m 


i 1641331-1641546 m 


1639401-1641173 m 


1638291-1639277 m 


! 1637397-1638200 p | 


2028876-2030531 m l 


2030524-2031201 m j 


2031201-2031857 m 


2031854-2032603 m 


SA-1 395.1 2032596-2033474 m 


2033476-2034321 m 


2034336-2035217 m 


1035400-1035831 m 


266442-267230 m | 


2035418-2036005 m 


2036002-2036742 m 


2036742-2037695 m I 


2038274-2038990 p 


SA-1 371.1 


SA-1 372.1 


SA-1 373.2 


SA-1 374.3 


SA-1 377.1 j 


SA-1 378.1 


SA-1 379.1 


SA-1 38.1 


SA-1 380.1 


SA-1381.1 


SA-1 382.1 


SA-1 383.1 


SA-1 384.1 


SA-1 385.1 


SA-1 386.1 I 


SA-1 388.1 i 


SA-1 389.1 


SA-1 390.2 | 


SA-1 391 .2 


SA-1 392.1 


SA-1 393.1 


SA-1 394.1 


SA-1396.1 | 


SA-1399.1 


SA-14.1 


SA-140.1 I 


SA-1 400.1 


527 ! SA-1 401.1 
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SA-1405.1 


CO 

o> 
xr 


CO 
CO 


o 
o 

LO 


o 
to 


CM 
O 

m 


CO 

o 

LO 


o 

LO 


909 


CO 

o 

LO 


h- 
o 

LO 


809 


609 


o 

LO 


x— 
m 


CM 
LO 


CO 

to 


Ti- 
to 


LO 
LO 


CO 
X— 

tn 


LO 


CO 
LO 


CO 

in 


o 

CM 

in 


CM 

in 


CO 
CM 

tn 


■t 

CM 

LO 


in 

CM 

in 


526 i 


CO 
CM 

in 


CO 
CM 

to 


o 

CO 

m 


! 2676 


2677 


2678 


2679 


2680 


i 2681 


2682 


2683 


2684 


2685 


2686 


2687 


2688 


2689 


2690 


2691 


I 2692 j 


j 2693 | 


2694 


2695 


2696 


2697 


2698 j 


2699 


! 2700 


2701 


2702 


2703 


2704 


2705 


2706 | 


2707 


CM 

CO 
XT 
o 
C 

Q 

O 
LU 
CO 


CO 
CO 

o 

c 
Q 

O 

LU 

to 


|SEQ IDn° 4814 


LO 
CO 

xf 

o 

c 
Q 

O 
LU 
CO 


|SEQ ID n° 4816 


|SEQ ID n° 4817 


SEQ ID n° 4818 


CO 
CO 

XJ- 

o 

Q 

O 
UJ 

CO 


|SEQ ID n° 4820 


CM 
CO 
xr 
o 
C 

Q 

a 

UJ 
CO 


SEQ ID n° 4822 


CO 
CM 
CO 
XT 
o 
C 

Q 

a 

LU 
CO 


SEQ ID n° 4824 


LO 

CM 
CO 

o 
C 

Q 
O 

LU 
CO 


|SEQ ID n° 4826 


SEQ ID n° 4827 j 


CO 
CM 
CO 
XT 
o 
C 

O 

o 

LU 

CO 


CO 
CM 
00 
XT 
o 
C 

Q 

O 
LU 

CO 


o 

CO 
00 

xr 

o 
C 

Q 

O 
LU 

CO 


|SEQIDn° 4831 


|SEQ ID n° 4832 


|SEQ ID n° 4833 


|SEQIDn°4834 


tn 

CO 
CO 

xr 

o 
C 

Q 

a 

LU 

CO 


|SEQIDn°4836 


|SEQIDn°4837 


|SEQ ID n° 4838 j 


|SEQ ID n° 4839 


o 

s 

o 
C 

Q 

O 
LU 
CO 


|SEQ ID n° 4841 


CM 

S 

NT 
o 
C 

Q 

a 

UJ 

CO 


CO 

CO 
Tf 
o 
C 

Q 

O 
LU 

CO 



WO 02/092818 



359 



PCT/IB02/03059 



Similar to unknown proteins 


Similar to unknown proteins | 


Unknown | 


Unknown I 


Similar to unknown proteins | 


similar to xylulose-5-phpsphate/fructose-6-phosphate 
phosphoketolase 


Similar to unknown proteins 


Weakly similar to transcriptional regulator (antiterminator) 


similar to unknown proteins 


similar to L-xylulose kinase J 


Unknown 


Similar to galactitol-spebific PTS enzyme IIC I 


similar to glycerate dehydrogenase j 


Unknown 


similar to undecaprenof kinase 


similar to competence negative regulator mecA | 


weakly similar to DNA t(*anslocase I 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamno^e-glucose polysaccharide 


157319-158089 p jsimilar to ABC transporter (ATP-binding protein) | 


similar to unknown protein I 


similar to aminotransferase, putative cysteine desulfurase 


similar to NifU protein 


similar to unknown protein j 


similar to serine-type D-'Ala-D-Ala carboxypeptidase (penicilin 
binding protein) 


similar to serine-type DMIa-D-Ala carboxypeptidase (penicilin 
binding protein) 


SOS ribosomal protein L31 j 


similar to metal ABC transporter (binding protein) 


Unknown | 


similar to dipeptidase | 


6091 15-610026 p Similar to unknown proteins | 


Similar to unknown proteins | 


Similar to unknown proteins | 


2039029-2039499 m 


2039471-2039929 m 


2039916-2040059 m 


26741*1 -267725 m 


2040065-2040535 m 


-1907193-1909571 m 


1909661-1910752 m 


1911069-1912748 m 


1912814-1913575 m | 


1913595-1915112 m ; 


1915178-1916167 m i 


1916189-1917640 m | 


1917738-1918694 m | 


1918713-1919732 m 


154278-155117 p 


155237-155992 p 


267824-269182 m j 


155994-157154 p 


158126-159388 p j 


159390-160622 p 


160609-161052 p 


161152-162570 p 


162642-163829 m 


163982-165217 m 


613213-613473 m 


611580-613100 p | 


269145-269570 m | 


610041-611438 p I 


608144-609118 p i 


607257-608147 p 
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SA-1415.1 
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SA-1 41 8.2 


SA-1 41 9.1 


SA-1 421.1 | 
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SA-1429. 1 


SA-143.1 | 
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Similar to unknown proteins ] 


| Similar to purine nucleoside hydrolase ! 


Similar to unknown protjeins | 


|asparaginyl«tRNA synthetase | 


similar to unknown proteins | 


similar to aspartate aminotransferase I 


similar to ATP-depende^nt DNA helicase - 1 


Similar to meso-2,3-butlanediol dehydrogenase (D-acetoin 
forming) 


similar to gamma-glutarnylcysteine synthetase (for the 
Njerminal part) and to cyanophycinsynthetase (C-terminal part) 


Similar to unknown proteins I 


Unknown | 


Similar to transcriptional regulators and to PTS enzyme li | 


I Similar to adenylosuccinate synthase | 


Unknown 


Similar to unknown protein | 


Putative PTS enzyme lip | 


similar to mannitol-specific PTS enzyme IIB | 


similar to mannitol-specific PTS enzyme IIA | 


Similar to hexulose-6-pl'iosphate synthase 


similar to putative acetyl transferase | 


Similar to hexulose-6-phosphate isomerase 


Similar to L-ribulose-5-phosphate 4-epimerase 


similar to hypothetical transaldolase 


Unknown | 


[Unknown | 


Similar to unknown proteins | 


iSimilar to unknown proteins | 


Similar to the putative s|gma factor ComX1 | 


similar to putative acetyl transferase 


ISimilar to phosphoglycerate mutase 


Similar to D.D-carboxyfieptidase 


Similar to N-acetyl muramidase | 


606690-607103 m 


605461-606444 m | 


604907-605464 m 


603521-604867 p 


269636-269917 m 


602307-603500 p | 


599714-602221 p ~ 


598842-599606 p 


1931763-1934015 p 


1930919-1931593 p 


270084-270542 p 


1929535-1930557 m 


1927872-1929164 m I 


1927556-1927849 p j 


1926600-1927247 m 


1924993-1926432 m 


1924687-1924965 m 


1924135-1924620 m 


1923357-1924022 m 


270919-271479 p 


i 1922490-1923353 m 


I 1921772-1922488 m 


1921114-1921761 m 


104233-104421 p 


104755-105075 p j 


105865-106416 p | 


SA-1478.1 106636-107055 p 


SA-1479.1 ; 107255-107734 p 


271579-272157 p 


107856-108548 p 


108545-109297 p 


109294-109869 p | 


SA-1 446.1 


SA-1 447.1 | 


SA-1448.1 ! 


SA-1449.1 ; 


SA-145.1 


SA-1450.1 ; 


I SA-1451.1 


I SA-1 453.2 


SA-1457.2 


SA-1458. 1 


SA-146.1 


I SA-1460.1 | 


SA-1462. 1 


SA-1 463.1 


SA-1465.1 


SA-1466. 1 


SA-1467.1 ! 


SA-1468.1 


SA-1469.1 


SA-147. 1 


SA-1470.1 


i SA-1471. 1 
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SA-148.1 | 
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Similar to transcription repressor of class 1 heat-shock (HrcA) 


Similar to heat shock protein GrpE 


Chaperone protein DnaK I 


Chaperone protein DnaJ 


similar to unknown protein I 


ribosomal protein L1 1 


similar to transmembrane efflux pump protein j 


similar to hypothetical N{-acyl-L-amino acid amidohydrolase 


similar to transcriptional regulator (LysR family) 


similar to unknown proteins _| 


similar to para-aminobehzoate synthase, component I I 


Similar to DNA translocase 


similar to peptidyl-prolyl [cis-trans isomerase 


similar to surface antige'n proteins, putative peptidoglycan bound 
iprotein (LPXTG motif) 


similar to unknown proteins 


similar to metal ABC transporter (permease) | 


similar to metal ABC trahsporter (ATP-binding protein) j 


similar to metal ABC trahsporter (binding protein) I 


similar to C5A peptidase, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


2087111-2087719 p i Unknown I 


similar to RNA polymerase ECF sigma factor I 


leucyl-tRNA synthetase 


similar to unknown protfeins j 


similar to competence protein ComFC j 


competence protein ComFA 


similar to unknown proteins 


sim ilar to cysteine synthetase A I 


similar to glycerol dehydrogenase 


similar to hypothetical transaldolase 


similar to transcriptional regulator (TetR/AcrR family) 


similar to formate acety'ltransferase | 


110012-111046 p 


111049-111621 p 


111802-113631 p | 


113920-115059 p 


272173-272880 p j 


1650563-1650988 m i 


1651199-1652581 m 


1652589-1653803 m 


1654062-1654967 p 


1655028-1655381 p 


1655410-1657125 m 


1657207-1659648 m j 


1659823-1660626 p 


745991-748792 p , 


273140-274087 m 


1660678-1661511 m 


1661513-1662229 m 


1662400-1663326 m 


2080002-2084714 p 


2084947-2085633 p | 


2085630-2087018 p \ 


274084-274575 m j 


2087806-2090307 m 


356072-356626 p 


355330-355995 p 


354041-355330 p 


353341-353985 m 


352324-353250 m 


351084-352172 p 


350348-351016 p 


275157-275765 m 


347882-350338 p 


SA-1483.1 , 


SA-1484.1 | 
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SA-1 506.1 
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SA-1512.2 ! 
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SA-1 51 8.1 


SA-1519.1 
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Similar to other proteins 


Similar to unknown proteins j 


similar to phosphomevklonate kinase | 


cell wall separation j 


similar to aminotransferase ! 


similar to unknown protein I 


Similar to unknown proteins I 


Similar to UDP-N-acetylmuramate-alanine ligase j 


similar to unknown protein, putative peptidoglycan bound protein 
(LPXTG motif) 


similar to Isopentenyl diphosphate isomerase | 


Similar to unknown proteins ] 


Similar to SWI/SNF farhily helicase 


Similar to GTP binding protein | 


Similar to primosome component (helicase loader) Dnal | 


Similar to unknown proteins | 


Similar to unknown protein I 


Unknown | 


similar to unknown protein 


similar to other protein j 


similar to penicillin-binding protein 2a | 


similar to other protein j 


putative peptidoglycan linked protein (LPXTG motif) | 


similar to ABC transporter (ATP-binding protein) | 


Similar to unknown protein, putative ABC transporter 
(permease) 


similar to unknown proteins 


Similar to unknown protein j 


Similar to unknown protein j 


Unknown | 


'Similar to 2,3-dihydroxybenzoate-AMP ligase (C-terminal 
1812894-1813433 m Idomain) 


JSimilar to 2,3-dihydroxybenzoate-AMP ligase (enterobactin 
1813437-1814261 m jsynthetase component E) 


Similar to transcription regulator 


1934954-1936210 p 


1934139-1934957 p | 


1448554-1449546 m J 


28975-30318 p 


31518-32693 p 


32683-33444 p j 


1725796-1726299 m 


1726385-1727716 m : 


1038856-1039578 m 


1447562-1448557 m 


1727726-1728343 m 


1728508-1731606 m 


1731762-1733072 m 


1733120-1734022 m 


1734019-1735194 m 


1735194-1735673 m | 


1447276-1447494 m | 


2102209-2103849 m | 


2101372-2102184 p 


2098935-2101256 m | 


2098525-2098698 m 


2096282-2098213 m 
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1810959-1811672 m 
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Similar to similar to Xaa-Pro dipeptidase 


similar to unknown proteins 


Similar to unknown protein 


similar to multidrug resistance protein 


nucleoside-diphosphate kinase 


hypothetical 


similar to unknown proteins 


similar to unknown proteins | 


similar to unknown proteins 


similar to other proteins 


similar to unknown proteins 


Similar to putative acetyl transferase 


Similar to unknown proteins | 


2043157-2043462 m Unknown 


Unknown | 


Similar to unknown proteins 


Unknown | 


weakly similar to integraise 


similar to unknown proteins | 


hypothetical gene 


Similar to transcriptional regulator (phage related) ] 


Similar to unknown proteins | 


Similar to unknown proteins 


Similar to chromosome segregation SMC protein 


Similar to ribonuclease III 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to two-component sensor histidine kinase | 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A reductase 


similar to two-component response regulator 


Similar to unknown proteins 


Similar to chorismate synthase | 


Similar to 3-dehydroquihate synthase | 


similar to 3-dehydroquihate dehydratase | 


1814891-1815343 m 


1815355-1816422 m I 


1445361-1446275 p 


1816522-1817238 m 


1817240-1818739 m 


959863-960279 p \ 


959293-959553 p 


957581-958246 p 


957253-957594 p | 


956387-957256 p 


1444618-1445274 p 


952252-956385 p 


2040862-2041 353 p 


2041346-2042614 p I 


2043446-2043847 m ! 


2043835-2045043 m 


2045045-2045437 m | 


2045504-2045959 m 


1444176-1444625 p 
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1506788-1507945 m I Similar to unknown proteins | 


1508080-1510224 p .Similar to unknown proteins | 


SOS ribosomal protein L20 | 


Similar to'ferredoxin 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A synthase 
(HMG-CoA synthase) 


Similar to unknown protoin 


Similar to tripeptidase 


Similar to unknown prothin 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 


similar to ferrichrome ABC transporter (ATP-binding protein) 


similar to ferrichrome ABC transporter (binding protein) | 


1520270-1521295 p « similar to ferrichrome ABC transporter (permease) 


Similar to ferrichrome ABC transporter (permease) 


Similar to unknown protein | 


thymidylate synthase 


Similar to two-componept sensor histidine kinase 


Similar to ABC transporter (permease) 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


similar to autoinducer-2 production protein (LuxS) 


similar to unknown proteins 


similar to unknown proteins 


similar to dihydrofolate reductase 


similar to unknown proteins | 


similar to poly(A) polymerase 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


Similar to ABC transporter (ATP-binding protein) 


Similar to ABC transporter (ATP-binding protein) | 


similar to unknown proteins j 


Similar to 4-alpha-glucanotransferase (amylomaitase) 


Similar to glycogen pho'sphorylase 


similar to plasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


1510465-1510824 m \ 


1513077-1513274 p 


1441627-1442799 p 


1513261-1513752 m 


1513781-1515001 m 


1515137-1516771 m 


1516895-1518349 p 


1518504-1519298 p 


1519322-1520254 p ! 


1521292-1522293 p ! 


1522323-1522976 m | 


1440634-1441473 m j 


SA-1 780.2 I 327377-328462 p 


326640-327380 p 


325757-326653 p 


324021-325628 p | 


323350-323832 m 


321662-323125 p 


320495-321649 p 


1440060-1440554 m ' 


319693-320025 p 


1469012-1470220 m 


1467133-1469001 m 


1466663-1467136 m 


1464857-1466596 m 


1463083-1464852 m | 


1462533-1463042 p 


1568308-1569804 m 


1566032-1568296 m 


1039655-1041916 m 


SA-1 766.1 | 
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similar to exodeoxyribonuclease VII small chain 


similar to exodeoxyribonuclease VII large chain | 


similar to unknown proteins 


similar to bifunctional m&hylenetetrahydrofolate dehydrogenase 
/ methenyltetrahydrofolate cyclohydrolase (FolD) 


similar to phosphomannbmutase - 


similar to amino acid ABC transporter (ATP-binding protein) } 


Similar to amino acid ABC transporter (permease) | 


similar to orotidine 5 -phosphate decarboxylase 


similar to ATP-dependent CIp protease subunit X 


similar to orotate phosphoribosyltransferase 


similar to dihydroorotaso 


similar to aspartate transcarbamoylase | 


similar to glutaminase of carbamoyl-phosphate synthase | 


similar to carbamoyl-phosphate synthase (glutamine- 
hydrolyzing) 


Unknown I 


Unknown ! 


Similar to glutamate racemase 


Similar to unknown proteins 


similar to hypothetical GTP-binding protein | 


Similar to unknown proteins | 


Similar to unknown protein 


Similar to integrase | 


similar to unknown proteins | 


similar to unknown proteins | 


Similar to ribosomal large subunit pseudouridine synthase 8 
(hypothetical) 


Similar to unknown protein j 


similar to transcriptional regulator 


Similar to TRK potassium uptake system protein TrkH | 


Similar to TRK potassium uptake system protein TrkA | 


similar to aminoglycoside 6-adenylyltranserase j 


Unknown j 


Unknown | 
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571188-572528 p 
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569375-570229 p 
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565836-566528 p 
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similar to unknown protein | 


Unknon, similar to unknown protein 


similar to unknown protein (transmembrane) | 


similar to ABC transportor (ATP-binding protein) j 


similar to transcription regulator (N-terminal part) 


similar to unknown protein | 


similar to unknown protein \ 


similar to unknown protein j 


similar to unknown transmembrane protein 


similar to unknown protein 


CAMP factor 


similar to unknown proteins | 


Unknown 


similar to unknown proteins | 


Unknown 


similar to unknown proteins 


Similar to fructose-spec|fic PTS enzyme IIABC | 


similar to Fructose-1-phbsphate kinase | 


similar to transcription repressor of fructose operon FruR 


Unknown 


similar to to Cell Wall M^uropeptide Branching Enzyme | 


similar to cell wall proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to 2-dehydropantoate 2-reductase 


Similar to transcriptional regulator (Lad family) I 


similar to esterase 


Similar to unknown proteins | 


Similar to unknown proteins 


manganese-dependent, superoxide dismutase | 


Similar to transcription antiterminator 


Similar to beta-glucoside-specific PTS enzyme IIABC | 


similar to oligopeptide ^BC transporter (ATP-binding protein) | 


similar to oligopeptide ABC transporter (ATP-binding protein) 


similar to oligopeptide ABC transporter (permease) | 


similar to oligopeptide /^BC transporter (permease) f 


similar to oligopeptide ABC transporter (binding protein) | 


2061728 m 


2062738 m 


2063668 m 


2064567 m | 


-2065848 m 


•2066711 m | 


-2067221 p 


-2067798 p 


-2068966 p 


2069425 m 


•2070365 m 


•1471253 m 


•1437127 m ; 


•1471633 m 


•1472232 m 


•1472783 m 


•1474936 m 


•1475844 m 


1476650 m 


1436646 m 


1477950 m 




1479725 m j 


1480863 m : 


-834167 p 


835218 m 


-836122 p 


-837213 p 


-837901 p j 


-839090 p 


-840951 p 


-171179 p | 


-170247 p 


-169188 p 


-168147 p | 


■167114 p 
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2069123- 


2069598- 


1470405- 


1436804- 


1471253- 
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similar to amino acid transporter I 


ribosomal protein L24 


ribosomal protein L5 


ribosomal protein SB ' I 


ribosomal protein L6 


ribosomal protein L18 


ribosomal protein S5* j 


ribosomal protein L30 | 


ribosomal protein L15 I 


similar to preprotein trarislocase SecY I 


adenylate kinase I 


Unknown 


similar to adenylosuccinate lyase 


similar to unknown proteins | 


similar to Holliday junction DNA helicase, subunit B j 


similar to homocysteine S-methyltransferase j 


similar to protein-tyrosirte phosphatase I 


similar to transcriptional regulator (GntR family) I 


DNA polymerase III (alpha subunit) ] 


similar to 6-phosphofructokinase | 


similar to pyruvate kinase 


similar to type-1 signal peptidase I 


Similar to galactose 6-P isomerase (A subunit) I 


similar to ATP-dependent CIp proteinase (ATP-binding subunit), 
CIpL 


Similar to galactose 6-P isomerase (B subunit) 


1 994560-1 995492 m Similar to tagatose-6-phosphate kinase 


Similar to tagatose 1 ,6-cJiP aldolase | 


Similar to unknown proteins j 


Similar to unknown proteins I 


Similar to sugar ABC transporter (ATP-binding protein) 


similar to phosphopentomutase 


similar to deoxyribose-phosphate aldolase j 


similar to transport system permease protein ( 


similar to uridine phosphorylase I 


similar to transcriptional regulator {GntR family) i 


1434490-1435866 m 


82132-82437 p 


82461-83003 p 


83361-83759 p | 


83869-84405 p 


84506-84862 p 


84881-85375 p 


85390-85569 p 


85694-86134 p 


86155-87459 p 


87554-88192 p 


61615-62718 p 


62804-64102 p 


64256-65158 p 


65447-66445 p 


1433541-1434485 m 


66597-67034 p 


974448-974816 m 


974961-978065 p 


978146-979168 p | 


SA-1906.1 979217-980719 p | 


980890-981447 p 


1996039-1996464 m 


1431339-1433447 p 


1995503-1996018 m 


1993581-1994558 m 


1992631-1993527 m 


1991685-1992536 m 


1990451-1991584 m 


2104019-2105230 m 


2105297-2105968 m 


2105998-2107200 m 


2107221-2108000 m 


2108158-2108895 p 


SA-188.1 | 


SA-1 881. 2 ! 


SA-1 882.2 ! 


" SA-1 883.1 | 
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• -SA-1886.1 


SA-1888.1 
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SA-1892.1 
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SA-1 894.2 ! 


SA-1897.1 


SA-1898.1 


SA-1 899.1 


SA-190.1 


975 , SA-1 900.3 


SA-1 901. 2 | 


SA-1 902.2 | 


SA-1904.1 1 


SA-1 908.2 i 


SA-1 909.2 
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SA-1 91 1.1 


SA-1912.1 
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ISEQ ID n° 5267 
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SEQ ID n° 5271 


ISEQ ID n° 5272 


ISEQ ID n° 5273 


ISEQ ID n° 5274 


SEQ ID n° 5275 
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Unknown 1 


chaperonin GroEL J 


similar to multidrug resistance protein 


Ribosomal protein L10 


Similar to unknown proteins 


excinuclease ABC (subunit C) j 


Transmembrane N-terniinal domain, C-terminal domain similar 
to hydrolases 


similar to NADH dehydrogenase 


similar to dipeptidase 


similar to unknown proteins | 


similar to unknown protfeins | 


1429976-1430341 m ribosomal protein L7/L12 I 


Hpr (ser) kinase/phosphatase J 


Similar to unknown proteins j 


Similar to unknown proteins ! 


Similar to unknown proteins | 


Similar to oxidoreductase 


Similar to unknown profeins | 


Similar to unknown proteins | 


Similar to unknown proteins 


Similar to signal recognition particle and to cell division protein 
FtsY 


similar to glycine betaine/carnitine/choline ABC transporter (ATP- 
binding protein) 


similar to choline ABC transporter (permease) j 


similar to glycine betaine/carnitine/choline ABC transporter 
(osmoprotectant-bindinjg protein) 


similar to glycine betaine/carnitine/choline ABC transporter 
(permease) 


similar to efflux protein (truncated) j 


similar to transcriptional regulator (Rgg like) ( 


Unknown | 


Unknown | 


Unknown 


pseudogene 


2108908-2109204 p 


2109304-21 10926 m 


1348211-1349551 m 


1430405-1430905 m 


1347385-1348152 p 


1345445-1347226 m 


1343622-1345403 p 


1342850-1343452 m ! 


1341397-1342803 m 


1340716-1341300 m 


1339967-1340701 m 


782771-783706 p 


782280-782543 p 


781741-782199 p 


779616-781778 p 


778468-779511 p 


778207-778335 m 


777299-778201 m 


776487-777299 m 


774840-776450 p 


256648-257793 m 


256013-256648 m 


255084-256010 m 


254433-255083 m 


253190-254176 p | 


252257-253117 p | 


251133-251414 p 


1429562-1429735 m | 


250713-251099 p | 


250324-250728 p 
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SA-1 934.2 
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1007 : SA-1 937.1 


1009 • SA-194.1 i 


SA-1 940.3 I 


SA-1 942.1 I 


SA-1 943.1 I 


SA-1 944.1 i 


SA-1 945.1 


SA-1 946.1 | 
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SA-1961.1 


o> 
o> 


CO 
CD 

o> 


cn 

CD 

o> 


o 
o 
o 


o 
o 


a 

o 


CO 

o 
o 


S 
o 


in 
o 
o 


CD 
O 
O 


o 
© 


CM 
O 


CO 

o 


3162 | 1014 


in 
o 


CO 

o 


r- 
o 


o 

CM 
O 


CM 
O 


CM 
CM 
O 


CO 
CM 
O 


CM 
O 


m 

CM 

o 


CO 
CM 
O 


CM 
O 


CO 
CM 
O 


3175 ■ 1029 


3176 ! 1030 


3177 | 1031 


3147 


3148 


3149 


3150 


3151 


3152 | 


3153 


3154 ! 


3155 1 


3156 


|SEQ ID n° 5293 : 3157 


3158 | 


3159 | 


3160 


3161 I 


3163 | 


3164 | 


3165 | 


3166 


3167 


3168 


3169 


3170 


3171 


3172 | 


3173 I 


3174 | 


SEQ ID n° 5283 


SEQ ID n° 5284 


to 

00 
CM 

to 

o 
C 

Q 

O 
LU 

GO 


SEQ ID n° 5286 


SEQ ID n° 5287 


|SEQ ID n° 5288 


SEQ ID n° 5289 


|SEQ ID n° 5290 


SEQ ID n 6 5291 


|SEQ ID n° 5292 


SEQ ID n° 5294 


|SEQ ID n° 5295 


|SEQ ID n° 5296 


SEQ ID n° 5297 


SEQ ID n e 5298 


SEQ ID n° 5299 


|SEQ ID n° 5300 


|SEQ ID n° 5301 


SEQ ID n e 5302 


SEQ ID n° 5303 


§ 

CO 

to 

o 

c 
O 

O 

LU 

CO 


SEQ ID n° 5305 


SEQ ID n° 5306 | 


SEQ ID n° 5307 


00 

o 

CO 
IO 

o 

c 
Q 

O 
LU 

CO 


|SEQ ID n° 5309 


|SEQIDn° 5310 


SEQ ID n° 5311 


SEQ ID n° 5312 


SEQ ID n° 5313 



WO 02/092818 



373 



PCT/IB02/03059 



! 



Unknown ) 


Unknown | 


similar to ATP-dependefit helicase | 


similar to unknown proteins | 


1392147-1392512 m Isimilar to unknown proteins 


1 390283-1 392160 m similar to conjugative transposon relaxase 


similar to plasmid proteiji (replication protein ?) | 


similar to lactose repressor 


similar to unknown proteins j 


Similar to unknown profeins 


similar to transcriptional regulator 


Unknown | 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 


862527-863243 p similar to unknown profeins | 


similar to methyl transferase (from transposon) 


Alanyl-tRNA synthetase 


similar to unknown profeins | 


Similar to unknown profeins | 


Similar to DNA mismatch repair protein MutS 


Similar to unknown profeins 


Similar to thioredoxin | 


Similar to transcriptional regulators I 


3.2 DNA restriction/modification and repair 


Similar to A/G-specific adenine glycosylase 


Similar to unknown protein | 


Similar to unknown proteins | 


Similar to unknown profeins 


Similar to other protein!. j 


Similar to transcriptional regulator | 


Similar to Cyclopropane fatty acid synthase | 


Similar to unknown proteins | 


Unknown 


1041931-1043013 m .similar to unknown profeins | 


similar to unknown profeins 


Similar to unknown profeins 


excinuclease ABC (sulaunit A) 


249517-250104 p 


249110-249517 p 


1393216-1395234 m I 


1392522-1392881 m 


1428750-1429565 m | 


1389373-1390128 m 


866024-866614 m 


865181-865939 p 


864963-865178 p 


864595-864918 p | 


863331-864149 p | 


1428091-1428513 m j 


859827-862445 p 


859326-859811 p 


1831275-1831817 m 


1828851-1831 190 m \ 


1828347-1828847 m 


1827952-1828266 m 


1827313-1827906 p i 


1427312-1428664 m ! 


1826012-1827136 p 


1866085-1866867 m 


1864869-1866041 p 


1864198-1864734 m 


1863567-1864154 m 


1862715-1863440 m 


1861455-1862645 p 


1860995-1861294 p | 


1025155-1025412 m ! 


1426882-1427328 m | 


1859666-1860112 m 


1819075-1821903 m 


SA-1 962.2 | 


SA-1 963.2 


SA-1 966.1 


SA-1 967.1 


1036 SA-1 968.1 
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SA-1 97.1 


SA-1971.2 


SA-1973.3 


SA-1 974.2 


SA-1 975.2 


SA-1 976.2 


SA-1 977.1 


SA-1 978.1 


SA-1 98.1 


SA-1982.1 


SA-1 983.2 


SA-1 985.2 


SA-1 986.1 


SA-1 987.1 


SA-1 988.1 


SA-1 989.1 


SA-1 99.1 


SA-1 990.2 


SA-1 992.2 


SA-1 993.1 


SA-1 994.1 


SA-1 995.1 
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SA-1 997.1 


SA-1 998.1 | 


SA-2.1 


SA-20.1 


SA-200.1 


SA-2000.1 
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3182 j 
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3187 ! 


3188 


3189 


3190 


3191 j 


3192 


3193 


3194 


3195 | 


3196 J 


3197 


3198 


3199 I 


3200 


3201 


3202 


3203 


3204 


3205 | 


3206 | 


3207 


3208 | 


3209 


3210 


3211 


3212 


3213 


|SEQ ID n° 5314 


|SEQ ID n° 5315 


|SEQ ID n' 5316 I 


|SEQIDn°5318 j 


SEQ ID n° 5319 


SEQ ID n° 5320 


SEQ ID n° 5321 


SEQ ID n° 5322 


|SEQ ID n° 5323 


SEQ ID n° 5324 


ISEQ ID n° 5325 


|SEQ ID n° 5326 


|SEQ ID n" 5327 | 


|SEQ ID n° 5328 


|SEQ ID n° 5329 


|SEQ ID n" 5330 


|SEQ ID n° 5331 


|SEQ ID n° 5332 


|SEQ ID n 8 5333 


|SEQ ID n° 5334 


|SEQ ID n° 5335 | 


|SEQ ID n° 5336 


|SEQ ID n° 5337 


|SEQ ID n° 5338 


|SEQ ID n° 5339 


|SEQ ID n° 5340 


|SEQ ID n° 5341 1 


|SEQ ID n° 5342 


|SEQ ID n° 5343 


| SEQ ID n° 5344 | 


|SEQ ID n° 5345 


|SEQ ID n° 5346 


|SEQ ID n° 5347 


|SEQ ID n° 5348 
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Similar to unknown proteins 1 


Similar to transport protein I 


30S ribosomal protein Si 8 | 


Similar to single strand binding protein | 


30S ribosomal protein S:5 | 


cell division protein FtsH I 


similar to hypoxanthine guanine phosphoribosyltransferase | 


similar to other protein | 


weakly similar to beta-lactamase | 


similar to unknown proteins | 


Similar to transcriptional regulator (Lad family) f 


similar to maltose ABC transporter (binding protein) j 


Similar to maltose/malttidextrin ABC transport system 
(permease) 


similar to maltodextrin ABC transporter (permease) | 


similar to di-tripeptide ABC transporter (permease) I 


Similar to putative mutator MutT protein f 


Unknown 


Unknown | 


similar to plasmid replication protein | 


2149459-2150064 p isimitar to unknown proteins 


2148362-2149462 p similar to other proteins j 


Unknown 


Unknown 


similar to unknown proteins I 


similar to cadmium-efflyx system accessory protein | 


putative transport protein 


hypothetical transport protein j 


similar to threonine synthase | 


similar to alcohol dehydrogenase | 


Unknown 


similar to alcohol-acetaldehyde dehydrogenase | 


similar to unknown profeins 


Similar to S-adenosylrrjethionine tRNA ribosyltransferase | 


Similar to transcriptional regulator, MarR family 


Similar to unknown proteins | 
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Similar to permease (gluconate ?) | 


Similar to putative glycerate kinase 


similar to unknown protfeins 


Similar to unknown proteins [ 


Similar to beta-glucosidase 


ribosomal protein S17 | 


ribosomal protein L29 | 


ribosomal protein L16 | 


ribosomal protein S3 


ribosomal protein L22 


ribosomal protein S19 | 


similar to plasmid transfer complex protein TrsK | 


ribosomal protein L2 | 


ribosomal protein L23 | 


ribosomal protein L4 | 


ribosomal protein L3 1 


ribosomal protein S10 I 


similar to transposase (truncated) 


similar to transposase, 'N-terminal part | 


Unknown ] 


Unknown | 


streptococcal C5a peptidase 


Similar to sucrose-6-phbsphate hydrolase | 


Similar to transcriptional regulator (Lad family) | 


Similar to transcription termination protein NusB | 


Similar to unknown proteins | 


Similar to translation elongation factor EF-P j 


similar to ABC transporter (ATP-binding protein) j 


similar to ABC transporter (binding protein) | 


glucose-6-phosphate isbmerase | 


similar to unknown protein 


similar to unknown protein j 


similar to putative ABC transporter (binding protein) | 


Unknown 


similar to unknown protein from conjugative transposon 


similar to UDP-glucose pyrophosphorylase j 


844892-846148 p 


843725-844867 p 


1425120-1425608 m 


842464-843558 m 


840968-842395 p 


81399-81659 p 


81167-81373 p 


80744-81157 p 
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79436-79714 p 


1423303-1425120 m : 


78504-79337 p 


78190-78486 p 


77567-78190 p 


76917-77543 p | 


76504-76812 p 


1351826-1352680 p 
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1358151-1361603 m j 
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1803454-1803888 m 
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1806098-1807819 m 
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similar to glycerol-3-phosphate dehydrogenase | 


similar to ribonuclease P protein component ( 


similar to unknown protein and to B. subtilis SpolllJ protein [ 


Unknown" " j 


Unknown | 


similar to hypothetical transcriptional regulator j 


Unknown I 


Unknown I 


similar to unknown protein from conjugative transposons I 


Unknown | 


Similar to unknown proteins | 


Unknown I 


Unknown | 


Unknown | 


Unknown | 


Unknown | 


Similar to manganese-dependent inorganic pyrophosphatase ) 


similar to plamsid transfer complex protein TraE | 


Similar to pyruvate-fornriate lyase activating enzyme j 


Similar to unknown protein | 


Similar to unknown proteins | 


Similar to unknown protein ] 


Similar to unknown protein | 


similar to unknown protein j 


similar to transposase j 


degenerate transposase j 


degenerate trnasposase | 


Degenerate transposase | 


Similar to histidine triad protein j 


laminin-binding surface! protein | 


similar to two-componeVit response regulator VncR | 


similar to two-component sensor histidine kinase VncS j 


Similar to transposase C-terminal end (truncated) j 


Similar to unknown proteins | 


similar to plasmid and conjugative transposon protein | 


similar to FtsW and Ro|dA proteins j 


469658-470674 m 1 


470844-471173 p 
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2047351-2048703 m 
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similar to unknown protein 


DNA gyrase, subunit B | 


similar to two-component response regulator | 


ribosomal protein L34 


Similar to unknown proteins 


similar to betaine ABC transporter permease and substrate 
binding protein 


similar to glycine betaine ABC transporter (ATP-binding protein) 


similar to transcription a;ntitermination factor nusG j 


similar to glycosyl transferase ! 


similar to glycosyl transferase 


similar to unknown protein 


similar to unknown proteins I 


similar to transporter j 


similar to staphylokinasfe and streptokinase j 


similar to unknown protein | 


similar to unknown protein | 


similar to succinic semialdehyde dehydrogenase 


similar to glycine betainfe transporter (N-terminal end) 


similar to glycine betaine transporter (C-terminal end) | 


similar to unknown protein C-terminal part | 


similar to unknown protein (N-terminal part) | 


similar to unknown protfeins ( 


similar to carbon starvation protein A 


similar to two-componeht response regulator lytR [ 


similar to two-componeht sensor histidine kinase LytS 


Unknown | 


Unknown 


Unknown | 


Similar to ATP-dependent RNA helicase, DEAD-box family 


putative ABC transporter (binding protein) 


similar to ABC transporter (permease) 


similar to ABC transporter (ATP-binding protein) 


Similar to unknown proteins j 


Similar to peptide-chairj-release factor 3 


630703-631263 p 


631264-633216 p 


1900897-1901571 m 


1901927-1902061 m 


1902245-1903600 m 


1903847-1905574 m 


1905593-1906816 m | 


2095537-2096076 m ! 


2094285-2095490 p 


2093024-2094220 p 


2091974-2092819 m 


1415704-1416552 p I 


2090684-2091931 p ! 
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Similar to surface proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to cardiolipin syhthetase I 


similar to formate-tetrahydrofolate ligase | 


similar to lipoate-proteiji ligase | 


similar to unknown profein 


similar to ATP-dependont CIp protease ATP-binding subunit 
ClpA 


Putative peptidoglycan jinked protein (LPXTG motif) | 


similar to trigger factor (prolyl isomerase) 


similar to unknown profein | 


similar to unknown protein 


similar to unknown profein 


similar to phosphometh ylpyrimidine kinase I 


similar to tRNA pseudouridine synthase A 


Similar to other proteinis { 


similar to unknown proteins 


similar to transcriptional regulator 


similar to DNA repair ahd recombination protein RecN 


similar to unknown proteins 


similar to unknown proteins \ 


Similar to unknown proteins 


similar to unknown proteins | 


similar to unknown protein 


similar to unknown protein | 


Unknown | 


similar to unknown protein j 


similar to unknown protein 


similar to transcriptional regulator, GntR family | 


similar to unknown protein | 


similar to other protein ] 


similar to thiol peroxidase j 


similar to unknown proteins 


Similar to PTS enzyme IIA | 


Similar to PTS enzyme IIB | 


Similar to galactitol-specific PTS enzyme IlC | 


819318-820856 p 


1140455-1 142050 m 


1142169-1143839 m 


1143928-1144947 m 


1144974-1145852 m 


1043463-1045295 m \ 


1410000-1414904 m 


120068-121351 p 


119069-119911 m 


118463-119032 p 


118002-118466 p 


117234-117992 p 


116495-117271 p 


115177-116424 p 


573586-574413 p I 


574400-574873 p 


574885-576543 p I 


576656-577492 p 


577467-578324 p | 


578299-578901 p 


1250993-1251574 m 


1250789-1250983 m 


1250191-1250733 m 


1409808-1409999 m | 


1249935-1250132 m 


1249362-1249913 m ! 


1248557-1249198 m 


1247788-1248552 m 


1247129-1247788 m | 


1246562-1247056 m 


1245953-1246486 p 


2001195-2001659 m 


2000888-2001193 m 


1999400-2000848 m 
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SA-2200.2 
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SA-2210.1 
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similar to anaerobic (class III) ribonucleotide reductase large 
subunit chain 


Unknown j 


similar to oxidoreductase I 


similar to unknown proteins I 


similar to anaerobic ribonucleotide reductase activator j 


Unknown - 


Similar to glutathione reductase ) 


Similar to unknown protein (secreted protein) j 


Similar to iron-sulfur cofactor synthesis protein (NifS like) I 


Similar to hypothetical thiamine biosynthesis protein Thil j 


similar to capsular polyglutamate biosynthesis 


Unknown | 


similar to fructose-bisphosphate aldolase class-ll | 


similar to L-2-hydroxyis;ocaproate dehydrogenase 


SOS ribosomal protein I.28 I 


putative peptidoglycan jinked protein (LPXTG motif) | 


Similar to sortase protein 
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Putative peptidoglycan linked protein (LPXTG motif) j 
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similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


similar to plasmid DNA topoisomerase j 


similar to plasmid proteins I 


Unknown | 


similar to dTDP-glucose-4,6-dehydratase 


similar to unknown proteins 


Unknown I 


similar to unknown proteins 


Unknown 


402013-402330 p Unknown I 


Unknown 


Unknown 


similar to unknown protein . 


Unknown 


Unknown 


Unknown j 


Unknown 


Unknown I 


similar to unknown proteins 


Unknown 


Unknown 


similar to plasmid replication protein 


Unknown I 


Unknown I 


Unknown 


Unknown 


hyaluronate lyase 


similar to other proteins 


similar to unknown proteins I 


similar to unknown protein j 


truncated, C-terminal part I 


similar to unknwon proteins (N-terminal part) | 


1312564-1313754 m Isimilar to unknwon proteins I 


similar to unknown proteins j 


Unknown | 


413430-415262 p 


411680-413428 p 


733632-737567 p , 


406491-406748 p j 


1318266-1319312 m 
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1314996-1318214 p | 


1314297-1314779 m 
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917842-918033 p 


733433-733630 p j 


732834-733436 p 


1311348-1312574 m 


1056055-1056402 m 
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3844 I 
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similar to alpha-acetolactate synthase | 


similar to alpha-acetolactate decarboxylase ( 


ribosomal protein S14 


ribosomal protein L36 I 


similar to hypothetical fibronectin-binding protein 


similar to unknown prort^ins 


Similar to ABC transporter (permease) 


Similar to ABC transporter (ATP-binding protein) ) 


similar to unknown proteins 


similar to tributyrin esteriase 


Unknown | 


similar to unknown proteins 


similar to ribose 5-phosphate isomerase 


similar to phosphopento'mutase 


similar to arsenate reductase (hypothetical) 


similar to purine nucleoside phosphorylase 


putative transport proteih I 


similar to purine-nucleoside phosphorylase | 


similar to unknown proteins I 


similar to transcriptional regulator (LysR family) | 


similar to unknown proteins 


similar to phosphoribosylaminoimidazole carboxylase II 


similar to phosphoribosylaminolmidazole carboxylase 


similar to phosphoribosylamine-glycine ligase 


similar to unknown proteins 


similar to acetyl xylan esterase (hypothetical) 


similar to glucose kinase and to XylR transcriptional regulator 


similar to N-acetylneura'minate lyase 


similar to unknown proteins 


Unknown | 


similar to unknown proteins I 


Similar to ABC transporter (permease) 


Similar to sugar ABC transporter (permease) \ 


Similar to ABC transporter (binding protein) j 


similar to unknown protfeins J 
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group B streptococcal surface immunogenic protein | 


similar to Streptococcus; equi zoocin A endopeptidase | 


similar to bifunctional 

phosphoribosylaminoimidazolecarboxamide 
formyltransferase/IMP cyclohydrolase 


similar to unknown proteins | 


similar to PhosphoribosVlglycinamide formyltransferase 


similar to phosphoribosylformylglycinamide cyclo-ligase I 


similar to phosphoribosylpyrophosphate amidotransferase | 


Unknown | 


similar to Phosphoribosyiformylglycinamidine synthase | 


similar to phosphoribosylaminoimidazolesuccinocarboxamide 
synthase 


similar to ATP-dependent protease CIpE | 


Similar to unknown proteins | 


similar to unknown proteins ) 


similar to unknown protein j 


isoleucyl-tRNA synthetase I 


similar to cell division protein DivlVA I 


similar to unknown proteins I 


Similar to unknown proteins I 


Similar to unknown proteins | 


Similar to unknown proteins | 


cell division protein FtsZ j 


Similar to cell division protein FtsA | 


Similar to cell division protein DivlB | 


Similar to undecaprenyl-PP-MurNAc-pentapeptide-UDPGIcNAc 
GlcNAc transferase 


Similar to UDP-N-acetyimuramoylalanine-D-glutamate ligase 


Similar to unknown proteins | 


similar to putative GTP-binding elongation factor 


similar to unknown proteins | 


similar to glucose kinase | 


similar to unknown proteins | 


47416-48720 p 


46370-47269 p I 
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similar to unknown proteins 


Unknown j 


similar to endonuclease III 


similar to other proteins 


Similar to Acetyl-COA iacetyltransferase (truncated) | 


Unknown | 


similar to biotin synthetase | 


similar to other proteins | 


similar to Anthranilate Synthase component II (Glutamine amido- 
transferase) 


similar to ABC transporter (exporter) (ATP-binding protein) j 


similar to ABC transporter (exporter) (ATP-binding protein) | 


Similar to unknown pro'teins 


similar to unknown protein | 


Unknown | 


similar to unknown proteins | 


similar to unknown proteins [ 


Similar to unknown proteins ] 


similar to unknown proi;eins | 


similar to phosphopantetheine adenyltransferase I 


Unknown | 


similar to unknown proteins ] 


Unknown | 


Similar to unknown proteins j 


Similar to asparagine synthetase 


similar to metal-dependent transcriptional regulator 


Similar to 5 -methylthioiadenosine nucleosidase/S- 
adenosylhomocysteine nucleosidase 


Similar to unknown proteins 


Similar to ADP-ribose pyrophosphatase I 


similar to UDP-N-acetylglucosamine pyrophosphorylase | 


Similar to unknown proteins | 


Similar to unknown proteins | 


similar to oxidoreductase | 


Unknown 


similar to unknown proteins C-terminal end | 


544450-544845 m 


1059491-1060447 p 


543817-544449 p 


542475-543704 p 


541439-542482 p | 


540863-541378 p 
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SA-399.1 \ 534259-534774 p 
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Unknown | 


similar to oxidoreductases i 


Similar to unknown proteins I 


Similar to unknown proteins 


similar to other proteins | 


similar to unknown proteins (C-terminal end) | 


Similar to other proteins (N-terminal part) 


Similar to unknown proteins | 


Similar to other protein;) | 


Unknown 


Unknown 


Similar to branched-chain amino acid transporter | 


methionyl-tRNA synthetase | 


Similar to other protein!) | 


Similar to unknown proteins | 


Similar to PTS enzyme IIC | 


Similar to unknown proteins | 


Unknown ! 


Similar to 3 -exo-deoxyjibonuclease 


Similar to other proteins | 


similar to 06-alkylguanjne-DNA-alkyltransferase I 


similar to phosphoglycerate dehydrogenase 


similar to unknown profeins 


similar to phosphoserinle aminotransferase | 


Similar to other proteins 


Unknown | 


Similar to unknown proteins | 


Similar to unknown proteins 


similar to DNA polymerase III (delta subunit) 


similar to thymidylate kinase 


Similar to acetoin dehydrogenase j 


similar to amino acid AE3C transporter (ATP-binding protein) ! 


similar to amino acid ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) | 
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Similar to riboflavin synthase complex beta chain 


Similar to GTP cyclohydrase II/ 3,4-dihydroxy-2-butanone-4- 
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Similar to ribiflavin synthase alpha chain 


Similar to two-component sensor histidine kinase 


Similar to riboflavin specific deaminase 
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Similar to manganese transporter 


Similar to unknwon proteins 
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Putative transmembrane protein 


Similar to other proteins, putative transmembrane protein j 


Similar to mannose-specific PTS enzyme HA 


Similar to mannose-spe'cific PTS enzyme IIB 


similar to putative membrane arginine transporter 
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2013713-2014210 p 'Similar to unknown proteins 


Similar to glutamyl-amirjopeptidase (hypothetical) I 


Similar to unknown proteins (NrdI) 


Similar to nucleotidase (esterase), putative peptidoglycan bound 
protein (LPXTG motif) 


similar to carbamate kinase 


1 794708-795178 p 


793500-794693 p 


792832-793482 p 


2159181-2160545 p 


791742-792851 p 


789673-791013 m 


788774-789571 p 


788438-788650 p 


787025-788311 p 


785969-786895 p 


2026535-2028718 m 


2025666-2026481 m 


2024637-2025389 m 


2024269-2024538 m 


2023298-2024146 m 


2022138-2023292 m 


E 

CM 
O) 

CM 

o 

IO 
h~ 
CO 

o 

s 

CM 


2020203-2020628 m 


2019694-2020185 m 


2160655-2162208 m 


2018869-2019678 m 


2018045-2018872 m 


2016258-2017907 m 


2015481-2016254 m 


2014432-2015469 m 


2012676-2013713 p j 


2012210-2012665 p 


2009651-2012053 p 


2162302-2163228 m I 


SA-647.1 


SA-648.1 


ai 
■d- 

«? 


SA-65.1 


| SA-651.1 


T— 

CO 

in 

5 

cn 


CM 
xt 

in 

5 

CO 


SA-655.2 


CM 

to 

IO 

<p 

$ 


CM 
LO 

< 
CO 


CM 
CO 
IO 

<? 


SA-660.1 


SA-661.1 


SA-662.1 


SA-663.1 


< 

CO 


i 

% 

CO 


SA-667.1 


CD 
CD 

? 

CO 


CO 


SA-670.1 


SA-671.1 


CM 
CO 

■ 

< 
CO 


co 
f- 

<? 
< 
CO 


SA-674.1 


x— 

to 
< 

CO 


CO 

< 

CO 


$ 


SA-678.1 


CO 

s 

CO 


2014 | 


2015 


2016 


2017 


2018 


2019 


2020 


2021 


2022 


2023 


2024 


2027 


2028 


2029 


2030 


2031 


2033 | 


2034 


2036 


2037 


2038 


2039 


2040 


2041 


2042 | 


2043 


2044 i 


2045 


2046 


2047 


4167 


4168 


4169 


4170 




4172 


4173 


4174 | 


4175 


4176 


4177 


4178 


4179 


4180 


4181 


4182 


4183 i 


4184 


4185 


4186 


4187 


4188 


4189 


4190 j 


4191 


4192 


4193 | 


4194 


4195 


4196 


SEQ ID n° 6303 


SEQ ID n° 6304 


|SEQ ID n° 6305 


|SEQ ID n° 6306 


SEQ ID n* 6307 


SEQ ID n° 6308 | 


SEQ ID n° 6309 


SEQ ID n° 6310 


|SEQ ID n° 6311 


|SEQ ID n°6312 


SEQ ID n" 6313 


|SEQ ID n" 6314 


SEQ ID n" 6315 


<o 

CO 
CO 

0 

c 
Q 

O 
ill 

CO 


|SEQ ID n° 6317 


SEQ ID n° 6318 


|SEQ ID n° 6319 ! 


o 

CM 
CO 
CD 
o 
C 

Q 

O 
LU 

CO 


SEQ ID n° 6321 | 


SEQ ID n° 6322 


|SEQ ID n°6323 


|SEQ ID n° 6324 


SEQ ID n° 6325 | 


|SEQIDn e 6326 S 


|SEQ ID n° 6327 | 


|SEQ ID n° 6328 j 


|SEQ ID n° 6329 | 


SEQ ID n° 6330 


SEQ ID n° 6331 


|SEQIDn°6332 



WO 02/092818 



403 



PCT/IB02/03059 



Similar to GTP pyropho'sphokinase (stringent response protein 
RelA) 


Similar to unknown profeins • | 


Similar to adhesion proteins | 


similar to pneumococcal histidine triad protein B precursor (N- 
terminal part) 


similar to pneumococcal histidine triad protein B precursor (C- 
Iterminal part) 


Similar to transcriptional regulator, DeoR family | 


similar to two-compone'nt response regulator 
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similar to transcription termination-antitermination factor nusA 


similar to unknown protein 


similar to putative ribosojual protein 


membrane protein similar to other proteins 


initiation factor 2 


ribosome binding factor A 


similar to esterase 


similar to negative transcriptional regulator (copper transport 
operon) 


similar to copper-transporting ATPase (CopA) | 


similar to copper chaperbne (copper transport operon) 


similar to unknown protein 


similar to unknown protein | 


similar to other proteins | 


DNA polymerase I 


similar to unknown protein | 


simiular to transcription regulator (Fur family) I 


similar to fibrinogen binding protein, putative peptidoglycan 
linked protein (LPXTG motif) 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


similar to unknown protein 


similar to tRNA-guanine, transglycosylase I 


similar to unknown proteins I 


similar to unknown protein (putative zinc finfer motif) | 


similar to biotin synthase | 


similar to unknown protein j 


similar to unknown protein | 


similar to unknown proteins 


similar to negative regulator of FtsZ ring formation protein EzrA 


similar to phosphoserine phosphatase | 


similar to unknown proteins | 


similar to unknown proteins | 


enolase 


441769-442920 p 


442942-443238 p 


443231-443533 p 


2169006-2171546 m 1 


443553-446336 p j 


446427-446795 p 


446B79-447883 m 


448047-448463 p 


448476-450710 p | 


450751-450957 p j 


451067-451681 p 


451696-452508 p 


2171530-2172279 m ; 


452621-455263 p 


455293-455733 p 


455815-456294 p 


456447-458012 p 


456125-458811 p ! 


458813-459850 p 


459864-460604 m 


460791-461933 p | 


2172407-2172763m 


462043-462351 p 


462358-462897 p j 


463036-463812 p 


463812-464318 p 


2172831-2175149 m 


I 

633310-635034 p 


635128-635769 p | 


635790-636275 m 


636288-636743 m 


636941-638248 p j 


i SA-747.1 


SA-748.1 


SA-749.1 


SA-75.1 


SA-751.1 


SA-752.1 


SA-753.1 


SA-754. 1 


SA-756.1 


SA-757. 1 


SA-758. 1 


SA-759. 1 


SA-76.1 


SA-760. 1 


SA-761.1 


SA-762. 1 


SA-765.1 


CO 
CD 

r-- 
i 
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(Si 


SA-767.1 | 


SA-768.2 


SA-769.2 j 


SA-77.1 


SA-770.1 


SA-772.1 


SA-773.1 | 


SA-774.2 | 


SA-78.2 


SA-782.2 


SA-783.1 


SA-784.1 


SA-785.1 


SA-786.1 


2113 


2114 


2115 


2116 


2117 


2118 


2119 


2120 


2121 | 


SEQ ID n° 6404 \ 4268 2122 


2123 


2124 I 


2125 i 


2126 


2127 


2128 


2129 


2130 


2131 


2132 


2133 ! 


2134 


2135 1 


2136 | 


2137 


2138 


2143 


2145 i 


2146 


2147 


oo 

CN 

o> 

OO 
CNI 


2149 ! 


| 4259 


SEQ ID n° 6396 I 4260 


4261 


4262 


4263 : 


4264 


SEQ ID n° 6401 4265 


SEQ ID n 8 6402 j 4266 | 


|SEQ ID n" 6403 I 4267 ! 


4269 | 
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4272 ! 


4273 , 
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4278 ! 


4279 ; 
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4288 : 
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SEQ ID n" 6397 
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similar to arginine repressor ArgR 


DNA mismatch repair protein MutS 


similar to cold shock protein E 


similar to DNA mismatch repair MutL | 


putative membrane-spa;nning protein (efflux transporter ?) 


similar to Holiday junction DNA helicase 


similar to unknown proteins 


similar to 3-methyl-aderjine DNA glycosylase I 


similar to competence-damage inducible protein CinA I 


recombination protein RecA ] 


similar to unknwon proteins 


similar to unknwon proteins | 


similar to unknown proteins 


similar to unknown proteins | 


similar to unknown proteins 


replicative DNA helicase DnaC 


Similar to trehalose-spetific PTS enzyme IIABC 


similar to trehalose-6-phosphate hydrolase | 


similar to hypothetical transcriptional antiterminator (BgIG family) 


similar to unknown proteins | 


putative transmembrane protein similar to unknown proteins j 


similar to other proteins (including putative transketolase) 


similar to other proteins (including putative transketolase) | 


SOS ribosomal protein L9 j 


similar to unknown proteins | 


ribosomal protein S15 


polynucleotide phosphojylase, alpha chain 


similar to unknown protein I 


similar to serine acetyltransferase 


Unknown 


cysteinyl-tRNA synthetase | 


similar to unknown protfeins 


similar to tRNA/rRNA rrjethyltransferase I 


similar to unknown protfein ) 


similar to unknown proteins | 


2135970-2136416 m ! 


2133337-2135913 m I 


2133077-2133280 p 


2130878-2132851 m | 


2129614-2130846 m 


2129022-2129612 m 


2177394-2177681 m 


2128448-2128999 m 


2127100-2128359 m 


2125887-2127026 m 


2125273-2125671 m 


2124805-2125071 m 


2124386-2124805 m 


2124043-2124360 m 


2122252-2123793 m 


2177693-2179048 m 


216500-218530 p 


218752-220377 p | 


220597-222633 p 


222636-222920 p \ 


222933-224288 p 


224291-225148 p 


225145-226074 p 


2179091-2179543 m 


226102-227442 p ! 


227530-227799 p 


228180-230309 p 


230311-231063 p | 


231072-231656 p 


231666-231848 p 


231845-233188 p 


233181-233567 p 


233676-234425 p 


234422-234940 p 


2179549-2181531 m 


SA-823. 1 


SA-825.1 


SA-826.1 ! 


SA-827. 1 ) 


SA-828. 1 


SA-829.1 


SA-83. 1 I 


SA-831. 1 | 


SA-832.1 


SA-833.1 


SA-834.1 


SA-835.1 


SA-837. 1 


SA-838. 1 


SA-839.2 


SA-84.1 j 


SA-842.3 | 


SA-843.1 


SA-844. 1 


SA-845. 1 


SA-846. 1 | 


SA-848. 1 


SA-849. 1 


SA-85. 1 


SA-850. 1 


SA-851. 1 


SA-852.1 


SA-853. 1 


SA-854.1 


SA-855.1 


SA-856.1 


SA-857.1 


SA-858.1 | 


SA-859. 1 


SA-86.1 
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2188 I 


2189 ! 
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2192 


2193 
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2195 
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2199 


2200 


2201 


2202 | 


2203 


2204 | 


2205 


2207 


2208 


2209 


2210 I 


2211 


2212 


2213 | 


2214 


2215 ! 


2216 


2217 


2218 


2219 


2220 


4324 


4325 


4326 j 


4327 I 


4328 
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4334 
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4339 
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4341 | 
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similar to unknown protein 


similar to transposase j 


tyrosyl-tRNA synthetase 


similar to penicillin-binding protein 1b 


RNA polymerase beta-subunit j 


Similar to GidA protein | 


RNA polymerase beta -subunit 


similar to unknown proteins 


similar to transporter (competence protein) 


probably part of the DNA transport machinery, ComGB protein 


similar to exogenous DNA-binding protein comGC | 


similar to hypothetical competence proteins 


similar to unknown proteins ! 


similar to hypothetical competence proteins 


similar to unknown proteins 


similar to unknown proteins 


acetate kinase | 


similar to transcriptional regulator 


similar to unknown proteins 


Unknown 


similar to dihydroorotate dehydrogenase A 


similar to unknown proteins | 


similar to Cell Wall Muropeptide Branching Enzyme 


similar to cell wall muropeptide branching enzyme 


similar to cell wall muropeptide branching enzyme | 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins | 


Similar to cation-transporting P-ATPase 


similar to unknown proteins | 


similar to fructose-1,6-b|sphosphatase 


Similar to other proteins | 


Unknown 


similar to tRNA (5-methylaminomethyl-2-thiouridylate)- 
methyltransferase 


235033-235893 p 


236878-238059 m 


181438-182697 m 


182808-185105 p 


185629-189204 p | 


2181598-2183499 m j 


189321-192971 p 


193085-193450 p 


193623-194594 p 


194440-195531 p 


195528-195857 p 


195832-196245 p 


196217-196516 p 


196470-196931 p 


196909-197280 p 


197395-198369 p | 


198401-199594 p ! 


199745-199951 p 


200188-200643 p 


579476-579673 p 


579717-580649 m 


2183669-2184280 m 


580836-582071 m 


582090-583301 m 


583314-584534 m 


584534-585346 m 


585417-586733 m 


586809-587195 p | 


587539-590223 p 


590268-591 128 m | 


591280-593211 p 


593301-594425 p 


1031191-1031673 m \ 


2184312-2185433 m 


SA-861.1 


SA-863.3 


SA-864.3 


SA-866.2 


SA-868. 1 


SA-87. 1 


SA-872. 1 


SA-874. 1 


SA-875. 1 


SA-876. 1 


r-~ 

°? 
< 

CO 


SA-878. 1 


SA-879. 1 


SA-880.1 | 


SA-881. 1 j 


SA-882. 1 i 


SA-883. 1 


SA-884. 1 


SA-885.2 | 


SA-887.2 


SA-889. 1 


SA-89. 1 


SA-890. 1 


SA-891. 1 


SA-892. 1 


SA-893. 1 


SA-894. 1 


SA-895. 1 


SA-896. 1 I 


SA-897. 1 | 


SA-898. 1 | 


SA-899. 1 


SA-9.1 


SA-90.1 | 


2221 


2222 


2223 


2224 


2226 ! 


2227 | 


2228 


2229 


2230 ; 


2231 


2232 


2233 ! 


2234 


2235 


2236 


2237 


2238 | 


2239 


2240 


2241 


2242 


2243 


2244 


2245 


2246 


2247 


2248 i 


2249 


2250 


2251 | 


2252 


2253 ; 


2254 


2255 


4359 


4360 


4361 


4362 


4363 | 


4364 | 


4365 


4366 


4367 


CO 
CO 

CO 

•<r 


o> 

<£> 
CO 


4370 


4371 


4372 


4373 ! 


4374 j 


4375 


4376 


4377 


4378 


4379 


4380 


4381 


4382 


4383 


4364 


4385 


4386 


4387 


4388 | 


4389 


4390 


4391 


4392 ! 


SEQ ID n° 6495 


|SEQ ID n° 6496 


|SEQ ID n° 6497 j 


|SEQ ID n° 6498 


|SEQ ID n° 6499 | 


|SEQ ID n° 6500 | 


SEQ ID n° 6501 ! 


SEQ ID n° 6502 


SEQ ID n° 6503 


SEQ ID n° 6504 


|SEQ ID n° 6505 


|SEQ ID n° 6506 ! 


|SEQ ID n° 6507 


SEQ ID n° 6508 


SEQ ID n° 6509 


ISEQ ID n° 6510 


ISEQIDn'6511 


SEQ ID n° 6512 


ISEQ ID n° 6513 


|SEQ ID n° 6514 


SEQ ID n° 6515 


SEQ ID n° 6516 


SEQ ID n° 6517 j 


ISEQ ID n° 6518 


|SEQ ID n°6519 


|SEQ ID n° 6520 


ISEQ ID n° 6521 


|SEQ ID n° 6522 


|SEQ ID n° 6523 


|SEQ ID n° 6524 ; 


SEQ ID n c 6525 ! 


SEQ ID n° 6526 j 


|SEQ ID n° 6527 


SEQ ID n 8 6528 
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Similar to peptide chain release factor RF-2 | 


Similar to cell division ATP-binding protein FtsE 


596287-597216 p 'Similar to cell-division protein FtsX i 


Similar to unknown proteins 


similar to unknown proteins 


H+-transporting ATP syjithase c chain 


H+-transporting ATP synthase a chain 


H+-transporting ATP syhthase b chain | 


similar to L-serine dehydratase beta subunit 


H+-transporting ATP sypthase delta chain 


H+-transporting ATP syhthase alpha chain 


H+-transporting ATP synthase gamma chain | 


H+-transporting ATP sypthase beta chain j 


H+-transporting ATP syhthase epsilon chain | 


UDP-N-acetylglucosam|ne 1-carboxyvinyltransferase 


similar to competence associated membrane nuclease 


Phenylalanyl-tRNA synthetase alpha chain 


similar to other proteins] | 


Phenylalanyl-tRNA synthetase beta chain 


similar to unknown proteins (C-terminal part) 


similar to ATP-dependeht exonuclease, subunit B 


similar to ATP-depende'nt exonuclease, subunit A 


similar to cation transporter | 


similar to putative tRNA modification GTPase TrmE j 


similar to L-serine dehydratase alpha subunit 


Similar to ribonucleotide diphosphate reductase small subunit 


Similar to ribonucleotide) reductase large subunit 


Similar to giutaredoxin 


Similar to histidine-containing phosphocarrier protein of the 
phosphotransferase system (PTS) 


phosphoenolpyruvate:sugar phosphotransferase system enzyme 


similar to glyceraldehyd,e-3-phosphate dehydrogenase | 


similar to oligosaccharide deacetylase | 


2187369-2188046 m (similar to other proteins; I 


594579-595592 p 


595611-596303 p I 


597269-597979 m 


597976-598611 m 


909887-910087 p 


910120-910836 p 


910854-911351 p 


2185679-2186347 p 


911351-911887 p 


911903-913408 p 


913424-914305 p | 


914379-915785 p 


915798-916211 p | 


916569-917840 p 


918108-918965 p I 


919256-920296 p j 


920379-920900 p j 


920954-923359 p 


923428-924096 m 


924207-927440 p | 


927430-931053 p 


931066-931992 p 


931967-933343 m | 


2186362-2187234 p 


866828-867787 m j 


867990-870149 m 


870227-870451 m 


870833-871096 p ! 


871101-872834 p 


872984-874411 p 


874551-875804 p 


SA-901.1 j 


SA-902.1 


SA-904.1 | 


SA-905.1 ! 


SA-906.2 i 


SA-907.2 


SA-908.2 


SA-909. 1 


SA-91. 1 i 


SA-91 0.1 


SA-91 1.1 


SA-91 2.1 


SA-91 3.1 


SA-914.1 


SA-916.1 


SA-917.1 


SA-918.1 


SA-91 9.1 | 


SA-920.1 | 


SA-921. 1 


SA-923.1 


SA-925. 1 


SA-926. 1 | 


SA-928.2 | 


SA-93.1 


I SA-930.2 


SA-931.2 ' 


SA-932.2 | 


SA-934.1 


SA-936.1 ; 


SA-937.1 


SA-939.1 


SA-94.1 


2256 


2257 j 


2258 ; 


2259 


4397 2260 


2261 


2262 I 


2263 


2264 


2265 j 


2266 


2267 


2268 


2269 | 


2270 | 


2271 


2272 | 


2273 


2274 


2275 


2276 ' 


2277 j 


2278 


2279 | 


2280 


2281 | 


2282 


2283 


2284 


2285 


2286 


2287 


2288 


4393 


4394 i 


4395 | 


4396 I 


SEQ ID n° 6534 ; 4398 j 


4399 


4400 


4401 | 


4402 


4403 


■>* 
o 
•* 
t 


4405 ! 


4406 I 


4407 


4408 


4409 


4410 | 


4411 ! 


4412 


4413 


4414 


4415 


4416 I 


4417 | 


4418 


4419 j 


4420 ; 


4421 


4422 


4423 


4424 


4425 


SEQ ID n° 6529 


|SEQ ID n° 6530 


|SEQ ID n° 6531 


|SEQ ID n* 6532 


SEQ ID n° 6533 


SEQ ID n° 6535 | 


ISEQ ID n°6536 


t-- 

co 
to 

CD 
o 
C 

O 

o 

UJ 

CO 


SEQ ID n° 6538 


SEQ ID n° 6539 


ISEQ ID n° 6540 


|SEQ ID n° 6541 


ISEQ ID n° 6542 [ 


CO 

■*J- 

LO 

CO 

e 

tz 

o 
a 

LU 

CO 


I SEQ ID n° 6544 


SEQ ID n° 6545 


ISEQ ID n° 6546 [ 


ISEQ ID n° 6547 


|SEQ ID n° 6548 | 


SEQ ID n 6 6549 


SEQ ID n° 6550 


SEQ ID n° 6551 


|SEQ ID n° 6552 


ISEQ ID n° 6553 


SEQ ID n° 6554 


|SEQ ID n° 6555 | 


ISEQ ID n" 6556 I 


SEQ ID n° 6557 


SEQ ID n° 6558 


SEQ ID n° 6559 


SEQ ID n° 6560 


SEQ ID n° 6561 
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similar to RNA helicase ] 


similar to uridine kinase I 


similar to unknown proteins 


similar to DNA polymeriase III gamma/tau subunit 


similar to unknown proteins | 


similar to transcriptional repressor of the biotin operon 


S-adenosylmethionine synthetase | 


similar to fibronectin-binding protein 


Unknown I 


hypothetical protein | 


similar to unknown proteins 


similar to unknown proteins 


similar to cation ABC transporter (ATP-binding protein) | 


Unknown 


Similar to unknown protein 


Similar to DNA-methyltrjansferase | 


Similar to plasmid relaxlase and mobilisation protein A 


similar to unknown proteins 


Unknown 


similar to aggregation piromoting protein (adhesin involved in 
high frequency of conjugation) 


hypothetical CDS | 


Unknown 


similar to plasmid unknown proteins | 


Unknown 


Similar to transfer complex protein TrsK - Lactococcus lactis 
plasmid pMRCOl 


Unknown | 


Similar to gram positive plasmid protein 


Unknown I 


Unknown | 


similar to plasmid unknown proteins 


Unknown | 


Similar to plasmid transfer complex protein TrsE I 


similar to two-component sensor histidine kinase | 


Similar to D-alanine-D-alanyl carrier protein ligase | 


875835-876917 m 


877062-877691 p 


877778-878275 p 


878275-879939 p ; 


880028-880222 p 


880203-881 138 m 


881323-882519 p 


883038-884945 p 


885012-885557 p 


885717-885845 p 


885953-886519 p 


886516-887070 p 


887074-888360 p | 


1170326-1171621 m 


1171761-1172060 m 


1172071-1173318 m 


1173315-1174946 m 


1174918-1175292 m ! 


1175295-1175858 m i 


| 2188179-2188718 m 


1175861-1176157 m 


1176201-1176500 m I 


11 76552-1 179788 m j 


1179790-1180155 m 


1180197-1182242 m 


1182242-1 182733 m 


1182755-1 183537 m | 


1183537-1183809 m 


1183829-1184434 m | 


1184455-1187145 m | 


1187178-1187708 p 


1187902-1190292 m 


1899710-1900897 m 


1898029-1899564 m 


SA-941. 1 | 


SA-942. 1 


SA-943. 1 


SA-944. 1 


SA-945. 1 


SA-946. 1 


SA-947. 1 


SA-948. 1 


SA-949. 1 


SA-950. 1 


SA-951. 1 


SA-952. 1 


SA-953.2 


SA-954. 1 


SA-955. 1 ! 


SA-956. 1 


SA-957. 1 


SA-958. 1 


SA-959. 1 


SA-96. 1 | 


SA-960. 1 


SA-961. 1 ! 


SA-964. 1 


SA-966.1 i 


SA-967. 1 


SA-968. 1 


SA-969. 1 


SA-970. 1 


SA-971. 1 | 


SA-973. 1 | 


SA-974. 1 


SA-975.2 


SA-976.2 


SA-977.1 | 


2289 


2290 


2291 


2292 


2293 | 


2294 


2295 


2296 , 


2297 


2298 


2299 


2300 


2301 


2302 


2303 


2304 


2305 


2306 


2307 


2308 


2309 


2310 | 


2311 | 


2312 


2313 


2314 


2315 


2316 


2317 ! 


2318 ! 


2319 


2320 | 


2321 


2322 


4426 


4427 i 


4428 


4429 ! 


4430 . 


4431 


4432 


4433 


4434 


4435 


4436 


4437 


4438 


4439 


4440 i 


4441 


4442 


4443 


4444 


i 

4445 


4446 


4447 


4448 | 


4449 ! 


4450 


4451 


4452 


4453 


4454 


4455 


4456 


4457 


4458 


4459 I 


SEQ ID n° 6562 


SEQ ID n 6 6563 I 


|SEQ ID n" 6564 


|SEQ ID n° 6565 


|SEQ ID n° 6566 ! 


SEQ ID n° 6567 


ISEQ ID n° 6568 


SEQ ID n° 6569 


|SEQ ID n° 6570 


SEQ ID n° 6571 


ISEQ ID n° 6572 


ISEQ ID n° 6573 


ISEQ ID n° 6574 


ISEQ ID n° 6575 


ISEQ ID n° 6576 


i~- 

IO 
CO 
o 
C 

Q 

O 
UJ 

CO 


SEQ ID n° 6578 ! 


o> 
r~ 
ir> 

CD 
o 
C 

Q 

o 

LU 

CO 


|SEQ ID n° 6580 


SEQ ID n° 6581 


SEQ ID n° 6582 j 


|SEQ ID n° 6583 


|SEQ ID n° 6584 


SEQ ID n° 6585 


SEQ ID n° 6586 


SEQ ID n° 6587 


SEQ ID n° 6588 


|SEQ ID n° 6589 


|SEQ ID n° 6590 


ISEQ ID n° 6591 


|SEQ ID n° 6592 


ISEQ ID n° 6593 


|SEQ ID n°6594 


|SEQ ID n° 6595 
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similar to LTA D-alanylation protein DItB 1 


putative ABC transporter (permease) I 


Similar to D-alanyl carrier protein 


similar to LTA D-alanine transfer protein DltD 


Unknown 


Unknown 


Unknown 


Unknown 


similar to unknown proteins 


similar to unknown proteins 


histidine triad family protein 


Similar to 16 rRNA (adeinine-N6,N6-)-dimethyltransferase 


1 .2 Transport/binding proteins and lipoproteins I 


Similar to 23S ribosomal RNA methyltransferase 


similar to unknown proteins 


similar to ribulose-5-phosphate 3-epimerase | 


Similar to unknown proteins 


Similar to unknown proteins 


similar to unknown proteins 


similar to transcription rfepressor of purine operon PurR 


qimilar to unknown proteins j 


similar to pyrroline-5-cafboxylate reductase 


1896767-1898032 m 


2188934-2189728 m 


1896513-1896752 m 


1895258-1896520 m 


1894691-1895083 m 


1893399-1894691 m 


1893016-1893408 m 


1892725-1893006 m 


1891761-1892543 m 


1891208-1891774 m 


1890755-1891204 m I 


1889856-1890728 m 


2189721-2190563 m 


1889001-1889852 m 


1887973-1888845 m j 


1887304-1887966 m 


1886679-1887311 m | 


1885403-1886677 m 


1884472-1885413 m 1 


1883563-1884375 m i 


200712-201377 p | 


201398-202168 m | 


SA-978. 1 


SA-98. 1 


SA-980. 1 


SA-981. 1 


SA-982. 1 


SA-983. 1 


SA-984. 1 


SA-985. 1 


SA-986.4 


SA-987.4 


SA-988.4 | 


SA-989.1 


SA-99. 1 


SA-990. 1 


SA-991. 1 


SA-993. 1 I 


SA-994. 1 | 


SA-995. 1 


SA-996. 1 


SA-997.2 ! 


SA-998.2 | 


SA-999.1 


2323 


2324 


2325 | 


2326 


2327 ; 


2328 


2329 


2330 


2331 I 


2332 


2333 | 


2334 


2335 


2336 I 


2337 


2338 


2339 I 


2340 


2341 | 


2342 | 


2343 | 


2344 


4460 


4461 


4462 i 


4463 


4464 


4465 


4466 | 


4467 | 


4468 


4469 


4470 ! 


4471 | 


4472 


4473 


4474 


4475 | 


4476 j 


4477 


4478 


4479 


4480 | 


4481 


SEQ ID n° 6596 


r- 
o> 
m 

CO 
o 
C 

Q 

O 
UJ 

</> 


|SEQ ID n° 6598 \ 


SEQ ID n 6 6599 | 


SEQ ID n" 6600 


|SEQ ID n° 6601 


SEQ ID n° 6602 


CO 

o 
to 
to 

o 

c 

a 

a 

LU 
U) 


-a 
o 
to 
to 

o 

c 
Q 

O 

HI 

t/> 


|SEQ ID n° 6605 


|SEQ ID n° 6606 i 


SEQ ID n° 6607 


|SEQ ID n° 6608 


|SEQ ID n° 6609 


SEQ ID n° 6610 


to 

CO 
o 
C 

Q 
O 

LU 

C/3 


|SEQ ID n° 6612 [ 


SEQ ID n° 6613 


|SEQ ID n° 6614 


|SEQ ID n°6615 


|SEQ ID n° 6616 | 


ISEQ ID n° 6617 • 
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TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 a SEQ ID No. 
1 39 sur la sequence genomique complete (SEQ ID No. 2345). 







Position sur genome 
complet (= SEQ ID n°2345) 


Sens 


SEQ ID 


Contig 


position Debut 


position Fin 


(m-minus / 

n=nlLi<*} 

|# |/l U O J 


SEQ ID n°1 


Contiol 


1356648 


1355991 


m 


SEQ ID n°2 


Contia2 

N-/ \J 1 1 LI A. 


341651 


341120 


m 


SEQ ID n°3 


Contia3 


476798 


476418 


m 

1 1 1 


SEQ ID n°4 


Contia4 


1475712 


1475086 


m 


SEQ ID n°5 




784818 


784243 


m 

1 1 1 


SEQ ID n°6 

VWVm 1 L/ II w 


Contia6 


1 756826 


1757251 




SEQ ID n°7 


Oontia7 

V/Ul 1 LIV4 ' 


1950108 


1 949648 


m 
1 1 1 


SEQ ID n°8 


Contia8 


138225 


1 v/L/l/ / VJ 


r> 


SEO ID n°9 


f^ontiriQ 


2097891 

*-L/%7 » U3 1 


2098283 


P 


SEQ ID n°10 

O U- II-/ 1 I IV 


VsV/l lULJ I V 


1238491 


1237984 

1 ^ s/ f 5U*t 


ill 


OtW IL/ II II 


V/Uiiuy i i 


1882130 


1881745 


m 




VyUI IlILJ 1 


1089348 


1 088935 


111 


SEQ ID n°13 

VL-Vj< 1 L/ II IO 


Cnntinl 3 


555788 


555189 

\J\J\J 1 L/W 


1 1 1 


SEO ID n°14 

WLVrf IL/ II l*r 


nnntin14 
V/v/i itiy i *r 


2017928 


2017437 


m 


SEQ ID n°15 

v/L.Vj{ 1 L/ II IV 


Hnntinl ^ 

V_/L/l IIILJ 1 >J 


1 154094 


1154701 




SEO ID n°16 

V/ L.SX 1 L/ II IV/ 


f^nntinlfi 

V./UI li>VJ 1 V/ 


752647 


7530Q1 


P 


SEQ ID n°17 

UI-Vm 11/ II If 


f^nntinl 7 

V/UI ILILJ 1 1 


1355561 


1355078 


m 


SEQ ID n°18 

S/I»\t( 1 L/ II IV 


Contial 8 

V>V/IIlILJ I \J 


1255951 


i2^fiim 

1 £JU 1 V/ 1 


P 


SEO ID n°19 

W L_ Va< ll_/ II 1^ 


wul IIILJ 1 9 


792712 


7Q314R 

i 1 MO 


P 


SEO ID n°20 

V/LV4 IL/ II C- V/ 


Contia20 


481787 


482228 


P 


SEO ID n°22 

Ol— Vjrf IL/ II £.^> 


VyUI ILIvJ^^ 


1 590263 


1 5Q0842 

1 <J\7V/l/*t^ 


P 


SEO ID n°23 


nnntin23 

v»VJI ILILJ^x/ 


508269 

x/V/V/C.l/9 


508918 


n 
P 


SEO ID n°24 

UL.W 1 L/ II fc^T 


fiontiri24 

V/V/l lLlvJ^"-t 


1 1421Q8 

1 1 *T«. 1 57L» 


1 142488 


P 


SEO ID n°25 

t/L>W IL/ II £~ \J 




1982019 


1981737 


in 


SEO ID n°26 

\J L- Vk IL/ II £-\J 




119342 


119919 


P 


SEO ID n°28 

OL-Vrt IL/ II 




1124069 


1123256 


III 


SEQ ID n°29 


Contig29 


266586 


266900 


n 

K 


SEQ ID n°30 


Contig30 


111013 


111623 


P 


SEQ ID n°31 


Contig31 


1804173 


1804706 


P 


SEQ ID n°32 


Contig32 


2170341 


2169828 


m 


SEQ ID n°33 


Contig33 


1959867 


1959394 


m 


SEQ ID n°34 


Contig34 


1295529 


1294939 


m 


SEQ ID n°35 


Contig35 


178592 


178071 


m 


SEQ ID n°36 


Contig36 


1857103 


1856614 


m 


SEQ ID n°37 


Contig37 


1063484 


1063911 


p 


SEQ ID n°38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID n°40 


Contlg40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 




SEQ ID n°42 


Contig42 


729008 


728453 


m 


SEQ ID n°43 


Contig43 


1671733 


1672151 
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SEQ ID n°44 


Contig44 


1103091 


1103644 


P 


SEQ ID n°45 


Contig45 


700139 


699583 


m 


SEQ ID n°46 


Contig46 


207521 


206897 


m 


SEQ ID n°47 


Contig47 


1064808 


1065099 


P 


SEQ ID n°48 


Contig48 


1091636 


1092281 


P 


SEQ ID n°49 


Contig49 


1701764 


1700906 


m 


SEQ ID n°50 


ContigSO 


609072 


609590 


P 


SEQ ID n°51 


Contig51 


1459271 


1458780 


m 


SEQ ID n°52 


Contig52 


60603 


60154 


m 


SEQ ID n°53 


Contig53 


289646 


289284 


m 


SEQ ID n°64 


Contig54 


1536438 


1536058 


m 


SEQ ID n°55 


Contig55 


509420 


510430 


P 


SEQ ID n°56 


Contig56 


1559964 


1558709 


m 


SEQ ID n°58 


Contig58 


2166712 


2165923 


m 


SEQ ID n°59 


Contig59 


1919605 


1920984 


P 


SEQ ID n°60 


Contig60 


962333 


960438 


m 


SEQ ID n°61 


Contig61 


1363649 


1365724 


P 


SEQ IDn°62 


Contig62 


1140306 


1137284 


m 


SEQ IDn°63 


Contig63 


1702242 


1706039 


P 


SEQIDn°64 


Contig64 


1490271 


1493283 


P 


| SEQIDn°65 


Contig65 


783206 


785628 


P 


SEQ ID n°66 


Contig66 


852318 


849615 


m 


SEQ ID n°67 


Contig67 


1882303 


1880181 


m 


SEQ ID n°68 


Contig68 


1614050 


1618058 


P 


SEQ ID n°69 


Contig69 


1484885 


1490042 


P 


SEQ ID n°70 


Contig70 


510495 


516449 


P 


SEQ ID n°71 


Contig71 


125082 


121213 


m 


SEQ ID n°72 


Contig72 


1557644 


1551892 


m 


SEQ ID n°73 


Contig73 


145707 


143269 


m 


SEQ ID n°74 


Contig74 


859105 


852465 


m 


SEQ ID n°75 


Contig75 


1219383 


1215342 


m 


SEQ ID n°76 


Contig76 


1091627 


1086724 


m 


SEQ ID n°77 


Contig77 


1245975 


1251984 


P 


SEQ ID n°78 


Contig78 


115260 


121688 


P 


SEQ ID n°79 


Contig79 


1100300 


1092624 


m 


SEQ ID n°80 


Contig80 


1107948 


1100525 


m 


SEQ ID n°81 


Contig81 


1245466 


1237461 


m 


SEQ ID n°82 


Contig82 


2111296 


2104033 


m 


SEQ ID n°83 


Contig83 


33479 


27132 


m 


SEQ ID n°84 


Contig84 


1339614 


1350526 


P 


SEQ ID n 85 


Contig85 


2070423 


2058143 


m 


SEQIDn°86 


Contig86 


1462530 


1470059 


P 


SEQ ID n°87 


Contig87 


526582 


517432 


m 


SEQ ID n°88 


Contig88 


1484487 


1470171 


m 


SEQ ID n°89 


Contig89 


1124087 


1136746 


P 


SEQ ID n°90 


Contig90 


1879890 


1866931 


m 


SEQ ID n°91 


Contig91 


1721684 


1706045 


m 


SEQ ID n°92 


Contig92 


1358184 


1357897 


m 


SEQ ID n°93 


Contig93 


1577596 


1560798 


m 


SEQ ID n°94 


Contig94 


115130 


103188 


m 
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SEQ ID n°95 


Contig95 


1921051 


1933881 


P 


SEQ ID n°96 


Contig96 


1944905 


1933782 


m 


SEQ ID n°97 


Contig97 


1919624 


1906953 


m 


SEQ ID n°98 


Contig98 


2090559 


2103658 


P 


SEQ ID n°99 


Contig99 


1237482 


1219423 


m 


SEQ IDn°100 


ContiglOO 


1123110 


1108191 


m 


SEQ IDn°101 


Contig101 


1551836 


1529458 


m 


SEQ IDn°102 


Contig102 


1818811 


1800978 


m 


SEQ IDn°103 


Contig103 


764781 


783195 


P 


SEQ IDn°104 


Contig104 


1086606 


1065938 


m 


SEQ IDn°105 


Contig105 


125425 


143102 


P 


SEQ IDn°106 


Contig106 


962438 


984387 


P 


SEQ ID n°107 


ContigT07 


1169838 


1190193 


P 


SEQ IDn°108 


Contig108 


2090426 


2070667 


m 


SEQ IDn p 109 


Contig109 


1140315 


1 169462 


P 


SEQ ID n°111 


Contig111 


238297 


258413 


P 


SEQ IDn°112 


Contig112 


216686 


237881 


P 


SEQ IDn°113 


Contig113 


2209521 


16967 


m 


SEQ IDn°114 


Contig114 


1883537 


1906918 


P 


SEQ IDn°115 


Contig115 


145772 


172009 


P 


SEQ IDn°116 


Contig116 


508181 


477405 


m 


SEQIDn°117 


Contig117 


859233 


888273 


P 


SEQIDn°118 


Contig118 


1529046 


1494213 


m 


SEQ IDn°119 


Contig119 


473132 


438871 


m 


SEQ IDn°120 


Contig120 


1981657 


1945366 


m 


SEQ ID n°121 


Contig121 


1613824 


1577594 


m 


SEQ IDn°122 


Contig122 


1765846 


1800817 


P 


SEQ ID n°123 


Contig123 


2111499 


! 2153851 


P 


SEQ IDn°124 


Contig124 


1721668 


1765765 


P 


SEQ IDn°125 


Contig125 


984406 


! 1025178 


P 


SEQ ID n°126 


Contig126 


1293488 


1339586 


P 


SEQ IDn°127 


Contig127 


216691 


176332 


m 


SEQ IDn°128 


Contig128 


1818941 


1866861 


P 


SEQ IDn°129 


Contig129 


849565 


785796 


m 


SEQ ID n°130 


Contig130 


888292 


960270 


P 


SEQ IDn°131 


Contig131 


2208563 


I 2155215 


m 


SEQ IDn°132 


Contig132 


33590 


88257 


P 


SEQ IDn°133 


Contig133 


1982609 


| 2057812 


P 


SEQ IDn°134 


Contig134 


1700642 


i 1618142 


m 


SEQIDn°135 


Contig135 


1293063 


i 1190375 


m 


SEQ IDn°136 


Contig136 


1366980 


1462324 


P 


SEQ ID n°137 


Contig137 


390853 


I 434186 


P 


SEQIDn°138 


Contig138 


357393 


259739 


m 


SEQ ID n°139 


Contig139 


527049 


716899 


P 
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TABLEAU 5 . Propriete d'adherence a des cellules 6pith61iales humaines en culture de la 
souche NEM316 de S. agalactiae et de souches mutantes derivees. 



Souche 


Gene inactive 


% d'adhesion" ! 






Cellules A549 


Cellules Hela 


NEM316 


aucun 


9 


16 


NEM1979 


IPF N° 1268 (srtA) 


1,5 


2 


NEM2056 


IPFN° 678 


2 


n.t. 


NEM2057 


IPFN° 1503 


4,5 


n.t. 



5 a , le pourcentage d'adhesion correspond au nombre de bacteries (Unite Formant des 
Colonies, UFC) restant adherentes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre d'UFC ajoutees a la monocouche de cellules epitheliales. 
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Amidase 


Amylopullulanase alkaline 


inconnue 
inconnue 


inconnue 
inconnue 


inconnue 


Surface exclusion protein 


inconnue 


Surface exclusion protein 


inconnue 


inconnue 


inconnue 


Proteine liant la fibronectine 


inconnue 
inconnue 


inconnue 


inconnue 


36 (54)/ 478 
35 (54)/ 492 


65 (79)/ 1095 


23(47)/ 373 
26(50)/ 273 


37(52)/ 405 
36(52)/ 399 


33 (49)/ 225 


24 (37)/ 715 


31 (47)/ 263 


22 (40)/ 784 


33 (47)/ 211 






32(46)/ 176 


27(42)/ 512 
25(38)/ 577 






AmiC (S pyogenes) 
YbgE (L. lactis) 


PulA (5. pyogenes) 


CGI 5040 gene product Drosophila 

melanogaster 
Antigen p200 (Babesia bigemina) 


SpaA ( S. sobrinus) 
Pas (S. intermedius) 


Plasmid-encoded protein (E. faecalis) 


13 

Si 
o 
o 

OO 


Plasmid-encoded protein (E. faecalis) 


Sec 10 (E. faecalis) 


Plasmid-encoded protein (E faecalis) 


No homology in public databases 


No homology in public databases 


PFBP (S. pyogenes) 


Hypothetical protein 2 (Lactobacillus 

leichmannii) 
Fimbrial structural subunit (Actinomyces 
naeslundii) 


No homology in public databases 


No homology in public databases 
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6247 


5842 


5741 


4921 


5090 


5180 


4706 


4708 


5677 


6246 


6411 


5578 


6446 


6447 


5607 
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TABLEAU 7 . Distribution des genes codant pour des prolines de surface a motif 
LPXTG parmi des isolats cliniques independants de 5 serotypes deS. agalactiae. 



ocq 1LI 


IN Q Irr 


Proportion des souches portant le gene 






Type la 


Type lb 


Type II 


Type III 


Type V 

16 
isolats 


non 
groupe 
2 isolats 


r requence 
tntf>!p 






23 isolats 


7 isolats 


12 isolats 


39 isolats 


y y i Ov i <x io 


4926 


1503 


100 


100 


100 


100 


100 


100 


100 


6331 


678 


100 


100 


100 


100 


100 


100 


100 


5491 


2192 


100 


100 


100 


100 


100 


100 


100 


5234 


1861 


100 


100 


100 


100 


100 


100 


100 


6246 


584 


100 


100 


100 


100 


100 


100 


100 


5842 


280 


100 


100 


100 


100 


100 


100 


100 


6247 


585 


86,9 


85,7 


91,7 


92,3 


81,3 


100 


88,9 


4965 


1551 


34,8 


85,7 


100 


94,8 


93,8 


100 


80,8 


6447 


807 


26,1 


85,7 


83,3 


92,3 


93,8 


100 


79,8 


5610 


2337 


86,9 


100 


100 


56,4 


100 


50 


78,8 


6236 


571 


82,6 


100 


83,3 


46,1 


100 


50 


71,7 


5103 


1716 


91,0 


100 


83,3 


38,5 


81,3 


50 


67,7 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71,4 


41,7 


61,5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41,7 


59 


12,5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20,5 


6,3 


0 


13,1 


5180 


18 


4,3 


14,3 


0 


20,5 


6,3 


0 


11,1 


4706 


1248 


0 


0 


0 


12,8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8,3 


5,1 


0 


0 


4,5 


4708 


1250 


0 


14,3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 


0 


0 


7,7 


0 


0 


3 
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TABLEAU 8 . Lipoproteines 



SeqID 

(ADN) 


N° 
d'IPF 


Annotation 


6527 


9 


unknown 


6030 


339 


similar to unknown proteins 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


45G 


Similar to ABC transporter (binding -protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protein) 


4596 


1119 


similar to ribose ABC transporter (binding protein) 


4636 


1162 


similar to (amino acid ?) ABC transporter (binding protein) 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protein) 


4836 


1399 


similar to phosphate ABC transporter (binding protein) 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl-prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protein) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein) 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/camitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIIU protein 


5450 


2133 


laminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 
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5559 


2278 


putative ABC transporter (binding protein) 


5591 


2314 


similar to protease maturation protein 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


similar to amino acid ABC transporter (binding protein) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoproteins ont et£ identifies sur la base de la 
prediction du motif de coupure / modification de type Iipoprot6ine [S. Hayashi, H. C. 
Wu. J Bioenerg Biomembr. 22, 451 (1990)] et d'un peptide signal (identifie en utilisant 
5 SignalP vs2.0 [H Nielsen, Prot Engin 12, 13-9. (1999)]) et par 1'analyse des resultats de 
comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al., Nucleic Acids Res 25, 3389-402. (1997)]. 



Tableau 9 . Autres proteines de surface 

10 



Seq ID 

(ADN) 


N° d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 



WO 02/092818 



422 



PCT/EB02/03059 



Ces proteines ont ete identifiees sur la base de similarity avec d'autres prolines 
de surface bacterienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrees au peptidoglycane et lipoproteines. 



5 TABLEAU 1 0 . Proteines impliquees dans la biosynthese de composes 
polysaccharidiques de la paroi de S. agalactiae. 



Seq ID 

(adn) 


N° d'IPF 


Annotation 


Commentates 






similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




OUOi 


Jo 1 


Unnown, Similar to UDP-N-acetylmuramoylalanine— D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to gly cosy 1 transferases 




6343 


692 


similar to hexosyltransferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthese de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta- 1 ,4-galactosyltransferase 


5614 


2341 


beta-1 ,4-galactosyltransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4,6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 
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5602 


2329 


similar to capsular polyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyltransferase 




5573 


2296 


Similar to rhamnosyl transferase I 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyltransferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


555 


Similar to putative glucosyl transferase 




6229 


562 


Similar to hypothetical glycosyl transferase 




6230 


563 


Similar to putative glycosyltransferase 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont 6te identifies par Tanalyse des resultats de similarity avec les 
sequences proteiques connues en utilisant le logiciel BLASTP. Les produits de ces 
genes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinales. 
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REVENDICATIONS 

1. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi les sequences SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucleotidique isoiee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi : 

a) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
choisie parmi SEQTD'No. 1 a SEQ ID No. 139 et SEQ ID No. 2345 ; 
10 b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 & SEQ ID No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucleotides ; 

c) une sequence nucleotidique compiementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou compiementaire d'une sequence 

15 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 
correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

20 comprenant au moins 20 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 

25 reference. 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 k SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 

30 2346 k SEQ ID No. 448 1 . 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie parmi les sequences 
SEQ ID No. 4482 a SEQ ID No. 6617 ; 
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b) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucleotidique compiementaire ou d'ARN correspondant k une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment repr6sentatif d'une sequence telle que 
dSfiriie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant au plus 
10 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucleotidique selon Tune des 
revendications 2 a 4. 

6. Polypeptide selon la revendication 5, caracterise en ce qu'il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 k SEQ ID No. 2344, et SEQ ID No. 

2346 & SEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 

a) un polypeptide selon Tune des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon l'une 
20 des revendications 5 et 6 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon Tune des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon Tune des revendications 5 
et 6, ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon l'une des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport a la 
sequence de reference. 

8. Sequence nucleotidique codant pour un polypeptide selon la revendication 

7. 

30 9. Sequence nucleotidique isolee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 4 
SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 . 
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10. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la biosynthese des acides amines ou Fun de ses fragments. 

11. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la biosynthese des cofacteurs, groupes prosthetiques et transporters ou 
Tun de ses fragments. 

12. Sequence nucleotidique selon Tune des revendications 2 4 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situe a la 

1 0 surface de Streptococcus agalactiae ou Fun de ses fragments. 

13. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pom* un polypeptide de Streptococcus agalactiae 
implique dans la machinerie cellulaire ou Fun de ses fragments. 

14. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme intermediate central ou Fun de ses fragments. 

15. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme energenique ou Fun de ses fragments. 

20 16. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 

caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme des acides gras et des phospholipides ou Fun de ses 
fragments. 

17. Sequence nucleotidique selon Fune des revendications 2 h 4, 8 et 9, 
25 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides ou Fun de ses fragments. 

18. Sequence nucleotidique selon Fune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 implique dans les fonctions de regulation ou Fun de ses fragments. 

19. Sequence nucleotidique selon Fune des revendications 2 k 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou Fun de ses* fragments. 
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20. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracteris£e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transcription ou Tun de ses fragments. 

21. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracteris6e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le processus de traduction ou Tun de ses fragments. 

22. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caract6risee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transport et de liaison des prolines ou Tun de ses 

1 0 fragments. 

23. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracteris^e en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans P adaptation aux conditions atypiques ou Tun de ses fragments. 

24. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
15 caract6risee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la sensibilite aux medicaments et analogues ou l'un de ses fragments. 

25. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans les fonctions relatives aux transposons ou l'un de ses fragments. 

20 26. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
61 94,6236,5497,5791 ,5 1 03,4705,56 1 0,5234,4926,633 1 ,6247,5842,574 1 ,492 1 ,5090,5 1 8 
0,4706,4708,5677,6246,6411,5578,6446^ de 

25 preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 

b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 
sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 

30 nucleotides ; 

d) une sequence nucleotidique compiementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 
au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

5 27. Sequence nucleotidique isolee de Streptococcus agalactiae, caract6ris6e en 

ce qu'elle est choisie parmi les sequences SEQ ED 
N°6035,6 137,6335,6377,6386,4495^ 

247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 et en ce qu'elle 
code pour une lipoproteine. 
10 28. Sequence nucleotidique isolee de Streptococcus agalactiae, caracteris^e en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°486 1 ,62 1 4,606 1 ,65 1 7,65 1 8,65 ^ 
6 1 5,56 1 4,56 1 3,56 U ,5696,597 1 ,5233,5602^ 

,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 
15 qu'elle code pour une proteine impliqu^e dans la biosynthese de composes 

polysaccharidiques de paroi. 

29. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae impliqug dans la biosynthese des 

acides amines ou Fun de ses fragments. 
20 30. Polypeptide selon l'une des revendications 5 a 7, caracteris6 en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

cofacteurs, groupes prosth&iques et transporteurs ou Fun de ses fragments. 

31. Polypeptide selon l'une des revendications 5 4 7, caract&isS en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ6 k la surface de Streptococcus 

25 agalactiae ou Fun de ses fragments. 

32. Polypeptide selon l'une des revendications 5 a 7, caracteris£ en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu6 dans la machinerie 
cellulaire ou Fun de ses fragments. 

33. Polypeptide selon l'une des revendications 5 a 7, caract£ris£ en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 

intermediate central ou Fun de ses fragments. 

34. Polypeptide selon l'une des revendications 5 4 7, caracteris£ en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae impliqu£ dans le metabolisme 
energ&ique ou Fun de ses fragments. 
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35. Polypeptide selon 1'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 
acides gras et des phospholipides ou Pun de ses fragments. 

36. Polypeptide selon Fune des revendications 5 & 7, caracterise en ce qu'il 
5 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou Fun de ses fragments. 

37. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions de 
regulation ou Tun de ses fragments. 

10 38. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
replication ou Fun de ses fragments. 

39. Polypeptide selon Fune des revendications 5 & 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

1 5 transcription ou Fun de ses fragments. 

40. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou Fun de ses fragments. 

41. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou Fun de ses fragments. 

42. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans Fadaptation aux 
conditions atypiques ou Fun de ses fragments. 

25 43. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibility aux 
medicaments et analogues ou Fun de ses fragments. 

44. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions 

30 relatives aux transposons ou Fun de ses fragments. 

45. Polypeptide selon Fune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrage LPXTG. 
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46. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 27 et est une lipoproteins 

47. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 28 et est une proline impliquSe dans la 

5 biosynth^se de composes polysaccharidiques de paroL 

48. Sequence nucleotidique utilisable comme amorce ou comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les sequences nucteotidiques 
selon Tune des revendications 2 a 4, 8 k 28. 

49. Sequence nucleotidique selon la revendication 48, caracterisee en ce qu'elle 
1 0 est marquee par un compose radioactif ou par un compose non radioactif. 

50. Sequence nucleotidique selon Tune des revendications 48 et 49, caracterisee 
en ce qu'elle est immobilisee sur un support, de maniere covalente ou non-covalente. 

51. Sequence nucleotidique selon la revendication 50, caracterisee en ce qu'elle 
est immobilisee sur un support tel qu'un filtre k haute density ou une puce k ADN. 

15 52. Sequence nucleotidique selon Tune des revendications 49 a 51 pour la 

detection et/ou P amplification de sequences nucleiques. 

53. Puce k ADN ou filtre, caracterisee en ce qu'elle contient au moins une 
sequence nucleotidique selon la revendication 51. 

54. Puce k ADN ou filtre selon la revendication 53, caracterisee en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur le support de ladite puce. 

55. Puce a ADN ou filtre selon la revendication 54, caracterisee en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associe a Streptococcus 
agalactiae, une bacterie du genre Streptococcus, et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espdce Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend une puce k ADN ou un filtre selon la revendication 53. 

57. Kit ou necessaire pour la detection et/ou 1' identification d'un micro- 
30 organisme, caracterise en ce qu'il comprend une puce a ADN ou un filtre selon Tune des 

revendications 54 et 55. 

58. Kit ou necessaire pour la detection et/ou la quantification de l'expression 
d'au moins un gene de Streptococcus agalactiae, caracterise en ce qu'il comprend une 
puce k ADN ou un filtre selon Tune des revendications 53 k 55. 
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59. Vecteur de clonage, et/ou d'expression, caracterise en ce qu'il contient une 
sequence nucieotidique selon Tune des revendications 1 a 4, 8 a 28. 

60. Cellule hote, caracterisee en ce qu'elle est transformee par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caracterisee en ce qu'il s'agit d'une 

bacterie appartenant au genre Streptococcus. 

62. Cellule hote selon la revendication 61, caracterisee en ce qu'il s'agit d'une 
bacterie appartenant a Pespece Streptococcus agalactiae. 

63. Vegetal ou animal, excepte PHomme, comprenant une cellule transformee 
1 0 selon Tune des revendications 60 a 62. 

64. Procede de preparation d'un polypeptide, caracterise en ce que Pon cultive 
une cellule transformee par un vecteur selon la revendication 59 dans des conditions 
permettant Pexpression dudit polypeptide et que Pon recupdre ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un procede selon la 

revendication 64. 

66. Procede de preparation d'un polypeptide synthetique selon Pune des 
revendications 5 a 7, 29 a 47, caracterise en ce que Pon effectue une synthdse chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caracterise en ce qu'il comprend au moins la sequence 

d'un polypeptide selon Pune des revendications 5 a 7, 29 a 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une reponse immunitaire chez Phomme ou 
1 'animal. 

68. Sequence nucieotidique codant pour un polypeptide hybride selon la 
25 revendication 67. 

69. Vecteur caracterise en ce qu'il contient une sequence nucieotidique selon la 
revendication 68. 

70. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps 
chimerique, caracterise en ce qu'il est capable de reconnaitre specifiquement un 

30 polypeptide selon Pune des revendications 5 a 7, 29 a 47, 65 et 67. 

71. Anticorps selon la revendication 70, caracterise en ce qu'il s'agit d'un 
anticorps marque. 
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72 ProcEde pour la detection et/ou T identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ou a un micro-organisme assocte dans un echantillon 
biologique, caractErisE en ce qu'il comprend les etapes suivantes : 

a) mise en contact de 1 'Echantillon biologique avec un anticorps selon Tune des 
5 revendications 70 et 71 ; 

b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

73. Procede pour la detection de 1' expression d'un gfene de Streptococcus 
agalactiae caractErise en ce que Ton met en contact une souche de Streptococcus 
agalactiae , avec un anticorps selon la revendication 70 ou 71 et que Ton detecte Ie 

1 0 complexe antigEne/anticorps eventuellement forme. 

74. Kit ou necessaire pour la mise en oeuvre d'un procede selon la revendication 
72 ou 73, caracterise en ce qu'il comprend les elements suivants : 

a) un anticorps selon Tune des revendications 70 et 71 ; 

b) Eventuellement, les rEactifs pour la constitution du milieu propice a la reaction 
1 5 immunologique ; 

c) eventuellement, les rEactifs permettant la mise en Evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

75. Polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67, ou 
anticorps selon Tune des revendications 64 et 65, caracterisE en ce qu'il est immobilise 

20 sur un support, notamment une puce a protEine. 

76. Puce a protEine, caractErisEe en ce qu'elle contient au moins un polypeptide 
selon Tune des revendications 5 a 7, 32 k 47, 65 et 67, ou au moins un anticorps selon 
Tune des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce k proline selon la revendication 76, caractErisEe en ce qu'elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins un anticorps dirigE contre un compose de micro-organisme autre 
que Streptococcus agalactiae, immobilise sur le support de ladite puce. 

78. Kit ou necessaire pour la detection et/ou 1* identification de bactEries 
appartenant a l'espece Streptococcus agalactiae ou k un micro-organisme associE, 

30 caracterise en ce qu'il comprend une puce a protEine selon Tune des revendications 76 
et 77. 

79. Kit ou necessaire pour la detection et/ou l'identification d'un micro- 
organisme, caracterise en ce qu'il comprend une puce k protEine selon la revendication 
77. 
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80. Procede de detection et/ou d' identification de bacteries appartenant a 
Pespece Streptococcus agalactiae ouaun micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il met en oeuvre une sequence nucieotidique selon Tune 
des revendications 2 & 4, 8, 9, 1 1 k 13, 17 a 25, 48 a 52 et 68. 
5 81. Procede selon la revendication 80, caracterise en ce qu'il comporte les 

etapes suivantes : 

a) eventuellement, isolement de l'ADN k partir de l'echantillon biologique & analyser, 
ou obtention d'un ADNc a partir de TARN de Pechantillon biologique ; 

b) amplification sp6cifique de 1'ADN de bacteries appartenant a Pespece Streptococcus 
10 agalactiae ouaun micro-organisme associe a l'aide d'au moins une amorce selon 

Tune des revendications 48 a 52 ; 

c) mise en evidence des produits d'amplification. 

82. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
Stapes suivantes : 

15 a) mise en contact d'une sonde nucieotidique selon Tune des revendications 48 a 52, 
avec un echantillon biologique, Pacide nucleique contenu dans Pechantillon 
biologique ayant, le cas echeant, prealablement ete rendu accessible a Phybridation, 
dans des conditions permettant Phybridation de la sonde a Pacide nucleique d'une 
bacterie appartenant a Pespece Streptococcus agalactiae ou aim micro-organisme 

20 associe ; 

b) mise en Evidence de Phybride Eventuellement forme entre la sonde nucieotidique et 
Pacide nucleique de Pechantillon biologique. 

83. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

25 a) mise en contact d'une sonde nucieotidique immobilisee sur un support selon la 
revendication 50 avec un echantillon biologique, Pacide nucleique de Pechantillon 
ayant, le cas echeant, ete prealablement rendu accessible a Phybridation, dans des 
conditions permettant Phybridation de la sonde k Pacide nucleique d'une bacterie 
appartenant a Pespece Streptococcus agalactiae ouaun micro-organisme associe ; 

30 b) mise en contact de Phybride forme entre la sonde nucieotidique immobilisee sur un 
support et Pacide nucleique contenu dans Pechantillon biologique, le cas echeant 
apres elimination de Pacide nucleique de Pechantillon biologique n'ayant pas 
hybride avec la sonde, avec une sonde nucieotidique marquee selon la revendication 
49; 
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c) mise en Evidence du nouvel hybride forme a Tetape b). 

84. Precede selon la revendication 83, caracterise en ce que, prealablement a 
Tetape a), l'ADN de l'6chantillon biologique ou TADNc obtenu eventuellement par 
transcription inverse de TARN de Techantillon, est amplifie a l'aide d'au moins une 

5 amorce selon Tune des revendications 48 k 52. 

85. Kit ou necessaire pour la detection et/ou T identification de bacteries 
appartenant a Tespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucieotidique selon Tune des revendications 48 k 52; 
10 b) Eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d'hybridation ; 

c) eventuellement, au moins une amorce selon Tune des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d'amplification de T ADN. 

86. Kit ou necessaire pour la detection et/ou T identification de bacteries 
15 appartenant a Tespece Streptococcus agalactiae ou a un micro-organisme associe, 

caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucieotidique, dite sonde de capture, selon la revendication 50 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, selon la revendication 49; 

c) eventuellement, au moins une amorce selon Tune des revendications 48 & 52 ainsi 
20 que les reactifs necessaires a une reaction d'amplification de TADN. 

87. Kit ou necessaire pour la detection et/ou T identification de bacteries 
appartenant a Tespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Tune des revendications 48 & 52; 
25 b) eventuellement, les reactifs necessaires pour efFectuer une reaction d'amplification 
d'ADN; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
amplifie, plus particulierement une sonde oligonucleotidique selon Tune des 
revendications 48 h 52. 

30 88. Procede selon les revendications 72, 73 et 80 & 84 ou kit ou necessaire selon 

les revendications 74, 78, 79 et 85 a 87 pour la detection et/ou T identification de 
bacteries appartenant a Tespece Streptococcus agalactiae, caracterise en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les sequences nucieotidiques selon Tune 
des revendications 2 h 4, 8 a 28, 48 a 52, et 68 specifiques de Tespece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parmi Ies polypeptides selon 
Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de Pespece Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticorps selon Tune des 
revendications 70 et 71 diriges contre les polypeptides choisis parmi les polypeptides 
5 selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espSce 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae, caracterisee en ce qu'elle contient au 
moins une mutation dans au moins une sequence nucleotidique selon Tune des 
revendications 2 a 4, 8 k 28. 
1 0 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation mene a une inactivation du gene. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 
en ce que la mutation mene a une surexpression du g£ne. 

92. Utilisation d'une sequence nucleotidique selon Tune des revendications 2 a 
15 4, 8 a 28, d'un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticorps selon Tune des revendications 70 et 71, d'une cellule selon Tune des 
revendications 60 a 62, et/ou d'un animal transform^ selon la revendication 63 pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
20 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees k une infection par 
Streptococcus agalactiae ou par un micro-organisme associe. 

93. Methode de selection de compose capable de se lier a un polypeptide selon 
1'une des revendications 5 a 7, 32 a 47, 65 et 67, capable de se lier a une sequence 

25 nucleotidique selon Tune des revendications 2 a 4, 8 k 28, ou capable de reconnaitre un 
anticorps selon Tune des revendications 70 et 71, et/ou capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de g£nes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon Tune des revendications 60 k 62, et/ou 
administration dudit compost k un animal transform^ selon la revendication 63 ; 
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b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
1 'expression de gdnes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 

5 pathologies liees a une infection par Streptococcus agalactiae ou par un micro- 

organisme associe. 

94. Composition pharmaceutique comprenant un compose choisi parmi les 
composes suivants : 

a) une sequence nucleotidique selon Tune des revendications 2 k 4, 8 a 28 ; 
10 b) un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 71 . 

95. Composition selon la revendication 94, eventuellement en association avec 
un vehicule pharmaceutiquement acceptable. 

1 5 96. Composition pharmaceutique selon Tune des revendications 94 et 95 pour la 

prevention et le traitement d'une infection par une bacterie appartenant a Tespfece 
Streptococcus agalactiae. 

97. Composition immunogene, caracterisee en ce qu'elle comprend un ou 
plusieurs polypeptides selon 1'une des revendications 5 a 7, 32 a 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d'une cellule selon l'une des revendications 60 a 62, ou d'un 
vecteur selon Tune des revendications 59 ou 69 pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracterisee en ce qu'elle contient un 
25 polynucleotide selon Tune des revendications 1 a 4, 8 a 28, un vecteur selon Tune des 

revendications 59 ou 69, et/ou une cellule selon Tune des revendications 60 k 62. 

100. Composition vaccinale, caracterisee en ce qu'elle contient au moins un 
polypeptide code par un polynucleotide de sequence choisie parmi SEQ ID 
N° 1 503,678,2 1 92, 1 86 1 ,5 84,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce qu'il 

s'agit d'une composition veterinaire 

102. Composition immunogene capable d'induire une reponse immunitaire 
cellulaire ou humorale pour la prevention ou le traitement d'une infection par une 
bacterie appartenant k Tespece Streptococcus agalactiae, caracterisee en ce qu'elle 



WO 02/092818 



438 



PCT/IB02/03059 



comprend une composition immunogene selon la revendication 97, ou une composition 
vaccinate selon la revendication 99 ou 100, en association avec un vehicule 
pharmaceutiquement acceptable et 6ventuellement un ou plusieurs adjuvants de 
Timmunite appropites. 

5 103. Banque genomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caracterisee en ce 
que ladite banque d'ADN est clon£e dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracterisee en ce qu'il s'agit 
10 de la banque dcSposee h la CNCM le 28 decembre 2000 sous le N° 1-2610. 

106. Utilisation des banques genomiques selon Tune des revendications 101 a 
103 pour isoler des sequences nucleotidiques sp£cifiques de Streptococcus agalactiae, 
caracterisee en ce que les sequences nucleotidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont align£es et en ce que les 

15 donnees obtenues par cet alignement sont traitees pour isoler lesdites sequences 
sp£cifiques. 

107. Proced6 d'identification de sequence sp£cifique de Streptococcus 
agalactiae, caract6rise par Talignement de sequences nucleotidiques de Streptococcus 
agalactiae selon les revendications 1 a 4, 8 a 9 et le traitement des donnees obtenues par 

20 cet alignement pour isoler les sequences specifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 d£pos6e a la CNCM le 24 avril 2002 sous le N° 1-2861. 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 d6pos6e & la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 d6posee a la CNCM le 24 avril 2002 sous le N° 1-2863. 



